【服務器數(shù)據(jù)恢復】RAID5重建導致數(shù)據(jù)丟失的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復環(huán)境:
HP某型號服務器,5塊硬盤組建了一組raid5磁盤陣列。

服務器故障&分析:
服務器在工作過程中,raid5磁盤陣列中的一塊磁盤掉線,由于raid5的容錯特點,raid陣列未受影響,工作人員也沒有及時關注磁盤離線的問題。服務器繼續(xù)運行一段時間后出現(xiàn)故障,管理員將現(xiàn)有的4塊磁盤進行了重建raid的操作,重建后進行了數(shù)據(jù)同步,原raid5陣列中的數(shù)據(jù)全部丟失。
HP SMART ARRAY在創(chuàng)建一組新的RAID5時,默認會全盤重建所有的塊校驗。這意味著在組成新創(chuàng)建RAID5的任一條帶中,總有一個校驗塊的數(shù)據(jù)是在創(chuàng)建raid時生成的,這個特性對于原raid陣列來說是極具破壞性的。
經(jīng)過分析,后生成的4盤RAID5組成結構是雙循環(huán)、64K塊大小、16次條帶換校驗。這意味著新組建raid5的4塊成員盤中,每隔3M就會有1M的數(shù)據(jù)是錯誤的。原5盤RAID5的組成結構為雙循環(huán)、塊大小128K、16次條帶換校驗。
要想恢復數(shù)據(jù)必須修復早掉線的那塊硬盤,數(shù)據(jù)恢復率取決于早掉線磁盤掉線之后數(shù)據(jù)變更多少。
最終敲定的數(shù)據(jù)恢復方案:對新舊raid5組成結構的差異性進行分析,用之前掉線的盤重新補回重建RAID時被破壞的校驗信息,再虛擬重組RAID并解釋文件系統(tǒng),然后導出文件。

服務器數(shù)據(jù)恢復過程:
1、將故障服務器中所有涉及到的硬盤以只讀方式進行全盤鏡像,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成再次的破壞。
2、基于鏡像文件分析所有磁盤底層數(shù)據(jù),根據(jù)破壞前后的數(shù)據(jù)痕跡分析新舊RAID5的結構。
3、分析新舊raid5組成結構差異,北亞企安數(shù)據(jù)恢復工程師編寫校驗修正程序。按原RAID5結構虛擬重組RAID,生成鏡像文件。
4、由北亞企安數(shù)據(jù)恢復工程師修正重組后的鏡像文件系統(tǒng)錯誤(所幸硬盤離線后數(shù)據(jù)變更很少,錯誤極少)。
5、導出部分分區(qū)數(shù)據(jù),將部分分區(qū)在無錯誤的前提下完全鏡像到準備好的新空間。
6、經(jīng)過數(shù)據(jù)恢復工程師和用戶方工程師的嚴格測試,確認恢復出來的數(shù)據(jù)完整有效。
