【服務(wù)器數(shù)據(jù)恢復(fù)】ext3文件系統(tǒng)下oracle數(shù)據(jù)恢復(fù)案例

服務(wù)器故障&檢測:
某公司一臺(tái)IBM某型號(hào)服務(wù)器共16塊硬盤,管理員某天巡檢的時(shí)候發(fā)現(xiàn)該服務(wù)器的10號(hào)和13號(hào)硬盤燈顯示黃色,服務(wù)器宕機(jī),服務(wù)器上跑的業(yè)務(wù)終止。
通過IBM storage manager查詢服務(wù)器狀態(tài),邏輯卷狀態(tài)報(bào)告“失敗”;6號(hào)盤的物理硬盤狀態(tài)報(bào)告“警告”,10號(hào)和13號(hào)盤報(bào)告“失敗”。通過IBM storage manager將當(dāng)前服務(wù)器的日志進(jìn)行完整備份,在備份的同時(shí)分析日志內(nèi)容,獲得部分邏輯卷信息用于后期數(shù)據(jù)恢復(fù)使用。

服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器內(nèi)所有硬盤編號(hào)并取出。對所有硬盤進(jìn)行物理故障檢測,16塊盤均能正常識(shí)別。檢測16塊盤的SMART狀態(tài),結(jié)果發(fā)現(xiàn)6號(hào)盤的SMART狀態(tài)為“警告”,和IBM storage manager中的報(bào)告一致。
2、將故障服務(wù)器中所有磁盤以只讀方式進(jìn)行扇區(qū)級別的鏡像備份。在鏡像過程中6號(hào)磁盤的鏡像速度異常緩慢,結(jié)合6號(hào)盤SMART狀態(tài)可以判斷6號(hào)盤應(yīng)該存在大量損壞的不穩(wěn)定扇區(qū),無法通過常規(guī)方式進(jìn)行鏡像。
3、使用專業(yè)設(shè)備對6號(hào)盤進(jìn)行鏡像,在鏡像過程中發(fā)現(xiàn)6號(hào)盤的壞道并不多,只是存在大量不穩(wěn)定扇區(qū)。調(diào)整鏡像策略,修改“遇到壞道跳過扇區(qū)數(shù)”、“響應(yīng)等待時(shí)間”等參數(shù)后繼續(xù)對6號(hào)盤鏡像。

4、所有磁盤鏡像完成后查看日志,發(fā)現(xiàn)在IBM storage manager和硬盤SMART狀態(tài)中均沒有發(fā)現(xiàn)異常的1號(hào)盤也存在壞道,10號(hào)和13號(hào)盤也存在大量不規(guī)律的壞道分布。根據(jù)壞道列表定位到目標(biāo)鏡像文件,經(jīng)過分析發(fā)現(xiàn)ext3文件系統(tǒng)的一些關(guān)鍵源數(shù)據(jù)信息被破壞。只能等所有硬盤鏡像完成后,通過同一條帶進(jìn)行xor
以及根據(jù)文件系統(tǒng)上下文關(guān)系手動(dòng)修復(fù)被損壞的文件系統(tǒng)。
5、雖然6號(hào)盤鏡像完成,但是先前所做的鏡像策略會(huì)自動(dòng)跳過一些不穩(wěn)定扇區(qū),所以6號(hào)盤的鏡像是不完整的。重新調(diào)整拷貝策略繼續(xù)鏡像被跳過的扇區(qū),完成6號(hào)盤所有扇區(qū)鏡像。
6、完成所有硬盤的鏡像后,北亞企安數(shù)據(jù)恢復(fù)工程師對ext3文件系統(tǒng)進(jìn)行逆向分析,結(jié)合對日志文件的分析,最終獲取到16塊盤的盤序,RAID塊大小,RAID的校驗(yàn)走向和方式等RAID相關(guān)信息。
7、利用獲取到的RAID相關(guān)信息虛擬重組RAID,重組完成后解析ext3文件系統(tǒng),通過和用戶溝通后提取出oracle的dmp文件并嘗試進(jìn)行恢復(fù)。在使用dmp文件進(jìn)行恢復(fù)的過程中,oracle報(bào)告imp-0008錯(cuò)誤。北亞企安的oracle工程師分析dmp文件的日志文件后發(fā)現(xiàn)提取出的dmp文件有問題。
8、重新分析raid結(jié)構(gòu),進(jìn)一步確定ext3文件系統(tǒng)被破壞的程度。經(jīng)過數(shù)據(jù)恢復(fù)工程師團(tuán)隊(duì)的不懈努力,終于重新提取出dmp文件和dbf原始庫文件。將提取出來的dmp文件移交給用戶,導(dǎo)入數(shù)據(jù)進(jìn)行測試沒有發(fā)現(xiàn)問題。對恢復(fù)出來的dbf原始庫文件進(jìn)行校驗(yàn),所有文件均通過測試。本次數(shù)據(jù)恢復(fù)工作完成。
