【服務(wù)器數(shù)據(jù)恢復(fù)】RAID5磁盤(pán)出現(xiàn)物理故障離線的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境&故障:
某品牌StorageWorks存儲(chǔ)設(shè)備,8塊磁盤(pán)組建一組raid5磁盤(pán)陣列。存儲(chǔ)中2塊磁盤(pán)掉線導(dǎo)致陣列崩潰,經(jīng)過(guò)檢查發(fā)現(xiàn)掉線的2塊磁盤(pán)均存在物理故障。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、硬件工程師對(duì)掉線的兩塊磁盤(pán)進(jìn)行檢測(cè),加電后磁頭無(wú)法尋道,分離PCB并清潔HDA組件后再次嘗試加電,磁頭依然無(wú)法尋道,需要進(jìn)行物理修復(fù)。經(jīng)過(guò)復(fù)雜的修復(fù)過(guò)程(此處略過(guò))后2塊故障硬盤(pán)可以正常識(shí)別。
2、將故障存儲(chǔ)內(nèi)所有磁盤(pán)以只讀方式進(jìn)行鏡像備份,后續(xù)數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免在恢復(fù)數(shù)據(jù)的過(guò)程中對(duì)原始數(shù)據(jù)造成二次破壞。
3、基于鏡像文件分析故障存儲(chǔ)設(shè)備中硬盤(pán)的底層數(shù)據(jù),發(fā)現(xiàn)所有磁盤(pán)的0扇區(qū)出現(xiàn)了“55 AA”(0x01C2H處表示該分區(qū)的類型,顯示“05”就表示這是一個(gè)擴(kuò)展分區(qū),從0扇區(qū)看這是一個(gè)不正常的 MBR 分區(qū)結(jié)構(gòu))。7號(hào)盤(pán)和8號(hào)盤(pán)的0扇區(qū)也找到了“55 AA”的標(biāo)志。8號(hào)硬盤(pán)是一個(gè)正常的MBR分區(qū),
其0x01C6處的數(shù)值代表指向的下一個(gè)扇區(qū)為GPT的頭部。

7號(hào)硬盤(pán)0x01C6處的數(shù)值代表指向下一個(gè)扇區(qū),但是下一個(gè)扇區(qū)很明顯不是GPT的頭部。

通過(guò)上面的分析,北亞企安數(shù)據(jù)恢復(fù)工程師初步判斷陣列中的8號(hào)盤(pán)和7號(hào)盤(pán)分別為第一塊和最后一塊硬盤(pán),GPT分區(qū)所在扇區(qū)起始于172032扇區(qū),因此初步確定LUN的起始扇區(qū)是172032扇區(qū)。
4、經(jīng)過(guò)分析raid確定了條帶大小為1024個(gè)扇區(qū)。按照1024扇區(qū)進(jìn)行分割,使一個(gè)記錄為一個(gè)條帶的大小。
5、當(dāng)7塊盤(pán)都定位到同一位置時(shí),通過(guò)對(duì)比可以判斷校驗(yàn)區(qū)的走向,繼而判斷整個(gè)RAID5的走向。之前已經(jīng)判斷出8號(hào)盤(pán)是第一塊盤(pán)了,把8號(hào)盤(pán)放在第一個(gè)位置,確定RAID5的走向和盤(pán)序。
6、上面已經(jīng)初步確定了LUN的起始扇區(qū)是172032扇區(qū),跳轉(zhuǎn)到172032扇區(qū)進(jìn)行觀察,正常情況下這個(gè)扇區(qū)所屬條帶中的5號(hào)盤(pán)應(yīng)該是校驗(yàn)區(qū),但實(shí)際顯示校驗(yàn)區(qū)為8號(hào)盤(pán)。根據(jù)該raid左走向的規(guī)律,5號(hào)盤(pán)的校驗(yàn)區(qū)應(yīng)該在172032-1024=171008扇區(qū),即上一個(gè)條帶。跳轉(zhuǎn)到171008扇區(qū),發(fā)現(xiàn)校驗(yàn)區(qū)為5號(hào)盤(pán)。因此可以確定LUN的起始扇區(qū)為171008扇區(qū)。
7、根據(jù)上面步驟中獲取到的raid相關(guān)信息使用工具重組raid。

8、由于數(shù)據(jù)從1024*8=8192個(gè)扇區(qū)開(kāi)始,剛組好的RAID必須和一個(gè)文件再進(jìn)行一次重組操作。RAID的起始扇區(qū)(Start sectors)選擇8192,這個(gè)文件可以任意選擇起始扇區(qū)和大小(Count sectors),下圖為重組后的raid5磁盤(pán)陣列。

數(shù)據(jù)驗(yàn)證:
RAID5磁盤(pán)陣列重建完成后由用戶方工程師進(jìn)行驗(yàn)證,經(jīng)過(guò)反復(fù)驗(yàn)證確認(rèn)恢復(fù)數(shù)據(jù)完整有效,本次數(shù)據(jù)恢復(fù)工作完成。