【服務(wù)器數(shù)據(jù)恢復(fù)】EMC存儲(chǔ)Zfs文件系統(tǒng)數(shù)據(jù)恢復(fù)案例

服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境:
某公司一臺(tái)EMC存儲(chǔ),12塊硬盤組成raid5,2塊熱備盤;
Zfs文件系統(tǒng)。

服務(wù)器存儲(chǔ)故障:
硬盤故障導(dǎo)致存儲(chǔ)崩潰。
服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)過(guò)程:
1、對(duì)故障存儲(chǔ)所有硬盤進(jìn)行物理故障檢測(cè),未發(fā)現(xiàn)有壞道或者其他物理故障。將故障存儲(chǔ)所有磁盤以只讀方式做鏡像備份,備份完成后將所有硬盤按照原樣恢復(fù)到故障存儲(chǔ)并交還給用戶,后續(xù)所有操作都在鏡像文件中進(jìn)行,避免對(duì)原始數(shù)據(jù)造成二次破壞。
2、故障存儲(chǔ)中的硬盤組建的是raid5磁盤陣列,至少需要2塊硬盤掉線才會(huì)導(dǎo)致raid5崩潰。前面物理故障檢測(cè)后并未發(fā)現(xiàn)硬盤存在物理故障,所以只需通過(guò)底層分析raid結(jié)構(gòu)并虛擬重組raid即可恢復(fù)數(shù)據(jù)。

3、通過(guò)分析鏡像文件,北亞數(shù)據(jù)恢復(fù)工程師獲取到故障存儲(chǔ)中raid5陣列的硬盤盤序、條帶大小、分布規(guī)律等。同時(shí)發(fā)現(xiàn)故障存儲(chǔ)原始raid5陣列中的兩塊熱備盤均未寫入任何數(shù)據(jù)。
4、根據(jù)分析獲得的riad5信息,通過(guò)北亞自研工具虛擬重組aid5陣列。
5、分析LUN在RAID陣列中的分配信息和LUN分配的數(shù)據(jù)塊MAP。
6、利用北亞自研的zfs文件系統(tǒng)解析工具解析lun文件系統(tǒng),在解析過(guò)程中發(fā)現(xiàn)部分zfs文件系統(tǒng)元文件破壞,北亞數(shù)據(jù)恢復(fù)工程師手動(dòng)修復(fù)這些被破壞的文件,直到能全部正常解析zfs文件系統(tǒng)。
7、Zfs文件系統(tǒng)解析完成后,繼續(xù)解析并導(dǎo)出故障存儲(chǔ)中的文件節(jié)點(diǎn)、目錄結(jié)構(gòu)。
8、數(shù)據(jù)恢復(fù)工程師驗(yàn)證導(dǎo)出的數(shù)據(jù)未發(fā)現(xiàn)錯(cuò)誤。把數(shù)據(jù)交付給用戶親自驗(yàn)證,經(jīng)過(guò)反復(fù)驗(yàn)證用戶確認(rèn)數(shù)據(jù)完整可用。
