【服務(wù)器數(shù)據(jù)恢復(fù)】熱備盤同步失敗導(dǎo)致raid5崩潰的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
兩組分別由4塊SAS硬盤組建的raid5磁盤陣列,ext3文件系統(tǒng),通過(guò)LVM管理磁盤存儲(chǔ)。
服務(wù)器故障:
一組raid5磁盤陣列中的1塊硬盤故障離線,熱備盤成功啟用并開始同步數(shù)據(jù),在同步還沒(méi)有完成的情況下該組raid5陣列中的另外一塊硬盤故障掉線,該組Raid5陣列崩潰,LVM結(jié)構(gòu)損壞,文件系統(tǒng)無(wú)法正常使用,服務(wù)器癱瘓。工作人員對(duì)掉線的硬盤進(jìn)行初檢檢測(cè),先掉線的硬盤無(wú)法識(shí)別,后掉線的硬盤可以識(shí)別。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、硬件工程師對(duì)無(wú)法識(shí)別的、先掉線的那塊硬盤進(jìn)行開盤檢測(cè),發(fā)現(xiàn)盤片磨損嚴(yán)重,無(wú)法恢復(fù)該盤的數(shù)據(jù),只能按照缺盤狀態(tài)進(jìn)行處理。
2、將故障raid5陣列和正常的raid5陣列中所有磁盤(除去最先掉線的那塊磁盤)以只讀方式進(jìn)行全盤鏡像備份,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。

3、基于鏡像文件分析原raid5磁盤陣列的校驗(yàn)方式、條帶大小、硬盤盤序等RAID相關(guān)信息,根據(jù)分析獲取到的raid相關(guān)信息重組兩組raid5陣列。

4、北亞企安數(shù)據(jù)恢復(fù)工程師基于兩組重組完成的raid5陣列分析底層數(shù)據(jù),分析出lvm結(jié)構(gòu)信息并導(dǎo)出作為pv的lun。重組pv并重新生成lvm邏輯卷。

5、完成LVM重組后,解析LV(邏輯卷)中的EXT3文件系統(tǒng),導(dǎo)出其中的全部數(shù)據(jù)。

服務(wù)器數(shù)據(jù)恢復(fù)結(jié)果:
由于陣列中的先掉線的硬盤盤片劃傷嚴(yán)重,無(wú)法修復(fù),且部分硬盤中存在壞道,raid結(jié)構(gòu)中存在缺陷,但是經(jīng)過(guò)用戶方工程師的反復(fù)檢測(cè),發(fā)現(xiàn)大部分文件恢復(fù)成功,確認(rèn)本次數(shù)據(jù)恢復(fù)結(jié)果有效。