【服務(wù)器數(shù)據(jù)恢復(fù)】Linux環(huán)境下RAID6磁盤(pán)陣列數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
linux操作系統(tǒng),文件系統(tǒng)EXT3;
12塊硬盤(pán)組成RAID6;
劃分3個(gè)LUN。

服務(wù)器運(yùn)行過(guò)程中RAID出現(xiàn)故障不可用,管理員重新分配RAID并進(jìn)行初始化。初始化超過(guò)50%的時(shí)候管理員發(fā)現(xiàn)情況有異,強(qiáng)行停止初始化,這時(shí)候已經(jīng)對(duì)數(shù)據(jù)造成不可逆的破壞。
原始RAID6失效后管理員用其中的11塊硬盤(pán)重新組建RAID5并進(jìn)行初始化,這種操作對(duì)原始數(shù)據(jù)造成不可逆的損壞。經(jīng)過(guò)北亞數(shù)據(jù)恢復(fù)工程師檢測(cè),僅第3個(gè)LUN可用普通RAID6恢復(fù)方法恢復(fù)出數(shù)據(jù),但第3個(gè)LUN沒(méi)有用戶(hù)想要恢復(fù)的重要數(shù)據(jù),重要數(shù)據(jù)都在第1個(gè)LUN。
我們數(shù)據(jù)恢復(fù)中心接到故障送修時(shí),這個(gè)case已經(jīng)在多家數(shù)據(jù)恢復(fù)公司做過(guò),但問(wèn)題仍未解決。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、對(duì)故障服務(wù)器中的12塊硬盤(pán)做鏡像備份。
2、基于鏡像文件分析12塊磁盤(pán)組建的RAID6的組織結(jié)構(gòu),分析11塊磁盤(pán)重分配RAID5的組織結(jié)構(gòu)。分析原始RAID6結(jié)構(gòu)比較順利,但由于底層RAID6和RAID5的大量信息重合,分析重分配的RAID5的結(jié)構(gòu)就比較困難,數(shù)據(jù)恢復(fù)工程師經(jīng)過(guò)近24小時(shí)的努力終于把重新分配的RAID5結(jié)構(gòu)搞清楚。
3、判斷可恢復(fù)性,北亞數(shù)據(jù)恢復(fù)工程師研究編寫(xiě)和校正恢復(fù)程序算法,通過(guò)程序把12塊磁盤(pán)中原始數(shù)據(jù)的第1和第2個(gè)LUN分別鏡像到搭好的存儲(chǔ)環(huán)境上。
4、經(jīng)過(guò)驗(yàn)證第2個(gè)LUN數(shù)據(jù)沒(méi)有問(wèn)題,但第1個(gè)LUN前面部分大約有十幾MB的數(shù)據(jù)被破壞。這前十幾MB數(shù)據(jù)包含了EXT3的根目錄和第一個(gè)塊組的I節(jié)點(diǎn),常用的數(shù)據(jù)恢復(fù)軟件恢復(fù)效果都不理想。
5、北亞數(shù)據(jù)恢復(fù)工程師只能手動(dòng)修復(fù)損壞的EXT3文件系統(tǒng),編寫(xiě)程序?qū)XT3根目錄進(jìn)行查找并重建根目錄和I節(jié)點(diǎn),用文件系統(tǒng)解析程序打開(kāi)完全正常。為了保證原始數(shù)據(jù)的權(quán)限和屬性,在LINUX下進(jìn)行簡(jiǎn)單修復(fù)后已能正常掛載,然后在LINUX下把文件拷貝到格式化為EXT3文件系統(tǒng) 的單塊磁盤(pán)的分區(qū)上。這樣用戶(hù)在使用數(shù)據(jù)時(shí)不再需要進(jìn)行設(shè)置,文件目錄結(jié)構(gòu)和屬性都和原來(lái)一模一樣。


