說“血案”有寫誇張了,其實是也就熬了一夜的通宵,做運維的傷不起啊,作為一名運維工程師,像這種伺服器突發故障半夜起床的情況屬於家常便飯,見怪不怪了,開始說正事: 前幾天半夜12點左右,收到伺服器宕機的消息,然後用dell idrac 卡遠程,結果無法通過它正常開機,直接發郵件給機房,讓他們重置下idr ...
說“血案”有寫誇張了,其實是也就熬了一夜的通宵,做運維的傷不起啊,作為一名運維工程師,像這種伺服器突發故障半夜起床的情況屬於家常便飯,見怪不怪了,開始說正事:
前幾天半夜12點左右,收到伺服器宕機的消息,然後用dell idrac 卡遠程,結果無法通過它正常開機,直接發郵件給機房,讓他們重置下idrac管理卡(就是拔掉電源線,過2分鐘後再插回去),
機房操作好之後,可以連上伺服器,結果還沒好1分鐘,機器又掛了,還是剛纔的情況,據我分析應該是哪裡硬體出問題了,再通知機房處理,這次機房人員反應,機器無法開機了,當時我有種
不好的預感,可能今晚睡不成了,電話詢問瞭解到伺服器插上電源線後,電源會有一些“滴水”的聲音發出,懷疑可能電源出問題了,先換了一條電源線,結果依舊,後來找了台同型號閑置的伺服器
的電源,打算讓機房人員換上看看,結果機房人員不給力,說電源拆不下來,也不敢暴力拆解,我也怕他拆壞,所以只有另想辦法,我突然想到能不能把硬碟換到同型號的伺服器上,這樣應該可以
開啟伺服器並儘快恢複線上業務,因為伺服器是dell 的R420,並且還在報修期內,所以當時就打了dell 官方售後電話:400-886-8618,想讓dell 工程師上門維修,不太現實,時間來不及,線上
業務要儘快恢復,所以只能咨詢看換硬碟的方案是否可行,得到dell 技術支持的肯定後,就開始換硬碟方案。
這裡介紹下,我們兩台伺服器(為了描述方便,我們記為A,B兩台伺服器,A為電源故障伺服器,B為正常伺服器),每台兩塊硬碟是做的raid1(兩塊硬碟互為備份),raid 卡 和機器配置都一樣,
滿足這樣的條件,換硬碟的方案才可行,下麵說下具體更換步驟:
1、把A機器的兩塊硬碟拔出,B機器關機,並且電源線也拔掉,然後把A的兩塊硬碟插入B機器上。
2、把B機器通電,開機,會有一個錯誤提示說有外部raid 信息,需要導入,按屏幕提示,進入raid 配置工具。
3、在“PD Mgmt”標簽中,可以看到兩塊一樣大小,State 都是“Foreign”的硬碟。
4、切換標簽到“Foreige View”,查看“Physical Disks”下有兩塊都是“Online”,但都是“Foreign”的硬碟。
5、然後把游標移到PERC H310 Mini (Bus 1,Dev 0) ,按F2,"Foreign Config" --> "import" ,回車,最後再確認,即可把raid 信息導入成功。(記住確認之後就相當於已經導入了,不需要保存)
附圖: