【服務器數(shù)據(jù)恢復】5節(jié)點Lustre分布式文件系統(tǒng)RAID5數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復環(huán)境:
5臺服務器節(jié)點,每臺服務器節(jié)點配置一組RAID5,每組6塊硬盤,其中1塊設(shè)置為熱備盤。
系統(tǒng)環(huán)境為Lustre分布式文件系統(tǒng),5臺服務器共同存儲全部的數(shù)據(jù)文件。

機房漏水導致服務器進水,服務器中的部分硬盤損壞。每組服務器有2塊及以上的盤掉線。由于短時間同時掉線2塊及以上硬盤導致RAID5崩潰,服務器,數(shù)據(jù)無法正常讀取。
服務器數(shù)據(jù)恢復過程:
1、為避免對原盤數(shù)據(jù)造成二次破壞,使用工具對故障服務器中所有正常硬盤進行鏡像備份。后續(xù)操作全部基于鏡像完成。
2、通過更換磁頭、修復固件等方式修復無法讀取的故障硬盤,并鏡像故障硬盤中的數(shù)據(jù)。
3、北亞數(shù)據(jù)恢復工程師通過分析磁盤中數(shù)據(jù)規(guī)律獲取到RAID校驗形式、條帶大小、盤序等RAID相關(guān)信息,并根據(jù)這些RAID信息虛擬重組出所有RAID整列。
4、解析Lustre分布式文件系統(tǒng)。

Lustre分布式系統(tǒng)由元數(shù)據(jù)卷(MDS)和數(shù)據(jù)卷(OST)組成,重組RAID后就可以看到MDS分區(qū)和OST分區(qū)。Lustre文件系統(tǒng)中所有文件的文件名、文件路徑等屬性信息存放在MDS分區(qū),而文件對應的數(shù)據(jù)內(nèi)容全部存放在OST分區(qū)中。
MDS分區(qū)是一個EXT3文件系統(tǒng),除了節(jié)點類型為文件的解析方式有所變化外,其余所有解析方式和Ext3一樣。
從MDS中獲取到整個Lustre中所有文件的目錄結(jié)構(gòu),文件名稱,文件編號,所屬OST號等屬性信息。
根據(jù)從MDS中獲取到的目錄結(jié)構(gòu),文件名稱,文件編號,所屬OST號等屬性信息,北亞數(shù)據(jù)恢復工程師整理重構(gòu)出文件的原始路徑,并定位到索引的OST卷及相關(guān)數(shù)據(jù)區(qū)域,獲取相關(guān)數(shù)據(jù)文件。
5、通過萬兆網(wǎng)絡將恢復出的所有數(shù)據(jù)拷貝到用戶準備好的設(shè)備環(huán)境中。
服務器數(shù)據(jù)恢復結(jié)果:
用戶親自檢查恢復出來的數(shù)據(jù),確認數(shù)據(jù)文件基本全部恢復出來,隨機抽取部分文件進行校驗,文件正確無誤,目錄結(jié)構(gòu)完好。本次數(shù)據(jù)恢復完成。
