【服務(wù)器數(shù)據(jù)恢復(fù)】離線硬盤強(qiáng)制上線導(dǎo)致RAID5崩潰的數(shù)據(jù)恢復(fù)

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
某品牌POWEREDGE某型號(hào)服務(wù)器,6塊SCSI硬盤組建RAID5磁盤陣列;
LINUX REDHAT操作系統(tǒng),EXT3文件系統(tǒng)。

經(jīng)過檢測(cè)以及和用戶溝通后,服務(wù)器數(shù)據(jù)恢復(fù)工程師初步推斷故障RAID5開始有一塊硬盤離線,但是管理員沒有發(fā)現(xiàn),直到另一塊硬盤掉線后RAID崩潰,服務(wù)器不可用。管理員聯(lián)系原廠工程師,原廠工程師建議將其中一塊掉線硬盤強(qiáng)制上線,但同時(shí)強(qiáng)調(diào)此操作的風(fēng)險(xiǎn)。管理員將其中一塊掉線硬盤強(qiáng)制上線后,發(fā)現(xiàn)操作系統(tǒng)啟動(dòng)異常,于是馬上關(guān)掉服務(wù)器,聯(lián)系我們數(shù)據(jù)恢復(fù)中心尋求幫助。
RAID5陣列2塊硬盤離線導(dǎo)致陣列崩潰這類故障非常普遍。硬盤強(qiáng)制上線具有較大風(fēng)險(xiǎn),上線錯(cuò)誤會(huì)導(dǎo)致RAID控制器自動(dòng)做出一些不可逆操作,再次進(jìn)入操作系統(tǒng)后,由于文件系統(tǒng)不一致會(huì)導(dǎo)致修復(fù),最終可能會(huì)造成全部硬盤數(shù)據(jù)不一致。本案例就是這類故障。

1、完整鏡像備份故障RAID中所有硬盤,在鏡像過程中發(fā)現(xiàn)多塊沒有下線的硬盤存在壞道,只是RAID沒有識(shí)別出來暫時(shí)沒有下線。
2、基于鏡像文件分析原RAID組成結(jié)構(gòu),根據(jù)原RAID信息構(gòu)建虛擬RAID環(huán)境。
3、驗(yàn)證RAID結(jié)構(gòu)的正確性,北亞數(shù)據(jù)恢復(fù)工程師修正部分后期被破壞的結(jié)構(gòu),然后將數(shù)據(jù)導(dǎo)出到另一存儲(chǔ)。
4、用新硬盤在故障服務(wù)器上搭建新RAID5磁盤陣列。
5、將數(shù)據(jù)遷移至新RAID陣列。
6、用戶親自對(duì)恢復(fù)出來的數(shù)據(jù)進(jìn)行驗(yàn)證沒有發(fā)現(xiàn)問題,確認(rèn)本次恢復(fù)數(shù)據(jù)完整有效。
