【服務(wù)器數(shù)據(jù)恢復(fù)】SUN光纖存儲(chǔ)卷映射出錯(cuò)的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
SUN光纖存儲(chǔ),組建RAID6,劃分若干LUN,MAP到不同業(yè)務(wù)服務(wù)器,操作系統(tǒng)是SUN SOLARIS。

服務(wù)器故障&分析:
由于需要增加一臺(tái)新服務(wù)器用來運(yùn)行新增的應(yīng)用,在原服務(wù)器還在線狀態(tài)下,用戶將其中一個(gè)lun映射到新服務(wù)器上。在執(zhí)行操作之前,用戶沒有搞清楚這個(gè)即將要映射過去卷實(shí)際上已經(jīng)map到了solaris生產(chǎn)系統(tǒng)上的某個(gè)lun上了。操作完成之后,這個(gè)卷開始進(jìn)行初始化,原本的solaris上的磁盤報(bào)錯(cuò)。用戶重啟服務(wù)器后發(fā)現(xiàn)這個(gè)卷已經(jīng)無法掛載了。后來在數(shù)據(jù)恢復(fù)之前經(jīng)過硬件工程師的檢測(cè),排除了服務(wù)器存在物理故障。用戶方工程師檢測(cè)后執(zhí)行fsck操作,完成操作后成功掛載文件系統(tǒng),但是查看數(shù)據(jù)時(shí)發(fā)現(xiàn)大量的數(shù)據(jù)丟失或者文件大小為0,而最新數(shù)據(jù)全部丟失。
故障分析:在正常工作模式下,san分配的卷為獨(dú)立占用模式,如果用戶將其映射給兩個(gè)或多個(gè)操作系統(tǒng)將會(huì)導(dǎo)致文件系統(tǒng)一致性出錯(cuò)。
如果出現(xiàn)這種故障,要想恢復(fù)數(shù)據(jù)首先要分析文件系統(tǒng)各個(gè)結(jié)構(gòu)的損壞狀態(tài)。本次數(shù)據(jù)恢復(fù)案例中故障服務(wù)器設(shè)備的文件系統(tǒng)采用UFS,所以對(duì)任何一個(gè)需要恢復(fù)的文件來說,需要優(yōu)先檢查目錄信息、節(jié)點(diǎn)、數(shù)據(jù)區(qū)是否正常。如果目錄信息、節(jié)點(diǎn)、數(shù)據(jù)區(qū)均正常,就可以完整恢復(fù)數(shù)據(jù)。但多數(shù)情況下,執(zhí)行fsck操作后INODE會(huì)被清除,即使留下目錄信息,也無法與數(shù)據(jù)一一對(duì)應(yīng),這種情況下就只能參考文件內(nèi)部格式進(jìn)行類型式的恢復(fù)。

服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、完整備份出現(xiàn)問題的lun。
2、基于備份文件解析文件系統(tǒng),服務(wù)器數(shù)據(jù)恢復(fù)工程師經(jīng)過分析發(fā)現(xiàn)元文件中的iNode已經(jīng)被清除,所以無法通過還原iNode來恢復(fù)數(shù)據(jù),只能通過文件類型進(jìn)行數(shù)據(jù)恢復(fù)。
3、服務(wù)器數(shù)據(jù)恢復(fù)工程師分析需要恢復(fù)的特定文件,發(fā)現(xiàn)采用vfs公文系統(tǒng)的索引文件具有強(qiáng)的類型特征,同時(shí)文件中包含目錄信息。于是,北亞企安數(shù)據(jù)數(shù)據(jù)恢復(fù)工程師按照公文系統(tǒng)的索引結(jié)構(gòu)特征編寫程序提取數(shù)據(jù),完成提取后根據(jù)特征重新命名。
4、按類型恢復(fù)數(shù)據(jù)文件,之后由用戶根據(jù)索引文件對(duì)數(shù)據(jù)文件進(jìn)行重新整理。
5、經(jīng)過2天的數(shù)據(jù)分析和恢復(fù)操作,北亞企安數(shù)據(jù)恢復(fù)工程師提取了故障服務(wù)器內(nèi)的絕大部分的數(shù)據(jù)和目錄索引文件,經(jīng)過用戶的反復(fù)驗(yàn)證,確認(rèn)所需要的重要數(shù)據(jù)已經(jīng)全部恢復(fù)。
