浪潮服務(wù)器硬盤壞道導(dǎo)致raid陣列崩潰的服務(wù)器數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
寧夏某市某單位的一臺(tái)浪潮服務(wù)器,該服務(wù)器中有一組由6塊SAS硬盤組建的RAID5陣列。
服務(wù)器上存放的是Oracle數(shù)據(jù)庫文件,操作系統(tǒng)層面劃分了1個(gè)卷。

服務(wù)器故障&初檢:
服務(wù)器在運(yùn)行過程中有兩塊磁盤的指示燈顯示黃色,RAID5陣列崩潰,服務(wù)器不可用。因?yàn)榉?wù)器已經(jīng)過保,用戶方聯(lián)系到我們數(shù)據(jù)恢復(fù)中心要求恢復(fù)服務(wù)器中的數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)工程師將故障服務(wù)器中6塊硬盤編號(hào)后取出,然后做硬件故障檢測(cè),經(jīng)過檢測(cè)發(fā)現(xiàn)亮黃色指示燈對(duì)應(yīng)的2塊硬盤有壞道、SMART的錯(cuò)誤冗余級(jí)別已經(jīng)超過閾值。

服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將另外4塊完好的硬盤以只讀方式做全盤鏡像備份。使用專業(yè)工具處理2塊有壞道的硬盤后再生成鏡像文件。
2、基于鏡像文件分析2塊故障硬盤的掉線時(shí)間,搞清楚數(shù)據(jù)較新的硬盤是哪一塊,然后用這塊數(shù)據(jù)較新的硬盤進(jìn)行數(shù)據(jù)恢復(fù)。
3、利用分析出來的原始raid5結(jié)構(gòu)信息虛擬重構(gòu)RAID陣列,在重構(gòu)出來的RAID5陣列中根據(jù)位圖信息將lun全部提取出來。
4、北亞企安數(shù)據(jù)恢復(fù)工程師分析底層結(jié)構(gòu)并導(dǎo)出用戶數(shù)據(jù),驗(yàn)證數(shù)據(jù)庫文件是否正常。
5、將卷里的文件都拷貝出來交給北亞企安數(shù)據(jù)庫工程師,數(shù)據(jù)庫工程師對(duì)數(shù)據(jù)庫進(jìn)行驗(yàn)證和導(dǎo)入數(shù)據(jù)。經(jīng)過驗(yàn)證,數(shù)據(jù)庫文件校驗(yàn)正常,數(shù)據(jù)導(dǎo)入也很正常。
6、重新備份數(shù)據(jù)庫,將數(shù)據(jù)庫文件和備份文件一同交付給用戶方,用戶方檢測(cè)后認(rèn)可恢復(fù)結(jié)果。本次服務(wù)器數(shù)據(jù)恢復(fù)工作完成。
