【服務器數(shù)據(jù)恢復】IBM存儲raid5多塊磁盤離線崩潰的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復環(huán)境:
IBM TotalStorage DS系列存儲,包含一個存儲機頭和多個存儲擴展柜,磁盤柜中的磁盤創(chuàng)建了多組RAID5。
其中6號擴展柜中的RAID5由15塊成員盤和1塊熱備硬盤組成。

服務器故障:
6號擴展柜中的一塊硬盤離線,熱備盤替換上線并開始同步數(shù)據(jù)。在熱備盤同步數(shù)據(jù)的過程中,又有一塊磁盤出現(xiàn)故障離線,熱備盤同步數(shù)據(jù)失敗,RAID5磁盤陣列失效,卷無法掛載訪問。
服務器數(shù)據(jù)恢復過程:
1、將出現(xiàn)故障raid的擴展柜中的所有磁盤以只讀方式做全盤鏡像, 后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像盤進行, 避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析故障raid結(jié)構(gòu),根據(jù)分析獲取到的raid相關(guān)信息虛擬重組raid,重組完成后使用自主開發(fā)的程序?qū)⒃搑aid中的所有l(wèi)un提取出來。

3、將重新配置的lun映射到恢復服務器,將提取出來的lun文件一對一拷貝到新創(chuàng)建的lun中。
4、將lun全部成功映射回原服務器,經(jīng)過檢查沒有發(fā)現(xiàn)問題。交由用戶驗證數(shù)據(jù),卻發(fā)現(xiàn)有部分目錄沒有找到。
5、經(jīng)過北亞企安數(shù)據(jù)恢復工程師的仔細檢查,發(fā)現(xiàn)lun6的部分數(shù)據(jù)錯亂,于是重新提取lun6。
6、完成重新提取后再次映射回原服務器。由用戶再次查驗,經(jīng)過反復檢測,沒有發(fā)現(xiàn)什么問題,確認恢復出來的數(shù)據(jù)有效。
服務器數(shù)據(jù)恢復結(jié)論:
存儲系統(tǒng)出現(xiàn)故障后,用戶沒有做任何破壞性的或者可能存在風險的操作,原始環(huán)境保存完好,保證了后續(xù)數(shù)據(jù)恢復工作的順利進行。
