重建MDisk導致上層Oracle數(shù)據(jù)庫不可用的服務(wù)器數(shù)據(jù)恢復案例

服務(wù)器數(shù)據(jù)恢復環(huán)境:
IBM某型號存儲;
Solaris操作系統(tǒng),部署Oracle數(shù)據(jù)庫。

服務(wù)器故障:
重建MDisk導致對應(yīng)的存儲池中的VDisk丟失,導致Solaris操作系統(tǒng)中的Oracle數(shù)據(jù)庫無法使用。

服務(wù)器數(shù)據(jù)恢復過程:
1、將所有涉及到Oracle數(shù)據(jù)庫的VDisk以只讀模式連接到北亞企安備份服務(wù)器上,在只讀模式下對映射過來的VDisk做鏡像備份。將重建后的MDisk成員盤編號,然后以正常模式取出存儲的磁盤柜。將取出的硬盤以只讀模式做全盤鏡像。備份完成以后將所有磁盤按照編號還原到故障存儲中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作均基于鏡像文件進行,避免對原始數(shù)據(jù)造成二次破壞。
2、基于鏡像文件對MDisk成員盤做數(shù)據(jù)分析,判斷是否因MDisk重建導致數(shù)據(jù)丟失。
3、分析重建后RAID6的數(shù)據(jù)分布規(guī)則,計算出RAID6的雙校驗,寫到硬盤的具體位置。
4、結(jié)合RAID6雙校驗破壞的數(shù)據(jù)區(qū)域和RAID10的數(shù)據(jù)分布規(guī)則,還原重建前的MDisk。
5、對恢復出來的MDisk做底層卷分析,取出精簡模式的數(shù)據(jù)MAP,并校驗數(shù)據(jù)MAP是否正常。
6、根據(jù)精簡模式的算法結(jié)合數(shù)據(jù)MAP還原VDisk。
7、檢測恢復的VDisk是否正常,如果不正常則重新分析上面步驟是否有誤。
8、對恢復出來的VDisk及其他未損壞的VDisk做Oracle數(shù)據(jù)庫頁特征掃描,并生成相應(yīng)的數(shù)據(jù)庫文件的特征集。
9、根據(jù)數(shù)據(jù)庫的特征集分析出數(shù)據(jù)庫在所有VDisk中的數(shù)據(jù)分布MAP。
10、根據(jù)數(shù)據(jù)庫在所有VDisk中的數(shù)據(jù)分布MAP恢復數(shù)據(jù)庫文件,使用北亞企安自主開發(fā)的Oracle數(shù)據(jù)庫檢測工具對恢復的數(shù)據(jù)庫文件做文件一致性檢測。 如數(shù)據(jù)庫文件正常、數(shù)據(jù)庫結(jié)構(gòu)完整,則嘗試啟動數(shù)據(jù)庫實例,同時監(jiān)控狀態(tài)。
11、MOUNT數(shù)據(jù)庫,查看數(shù)據(jù)庫文件狀態(tài)信息和數(shù)據(jù)庫整體狀態(tài)。嘗試打開數(shù)據(jù)庫,做實例恢復。
12、驗證數(shù)據(jù)是否正確,如果有問題則重復8-11的操作,直到數(shù)據(jù)完全正確為止。
13、驗證數(shù)據(jù)沒有問題后,交由用戶方進行檢測。經(jīng)過用戶方的檢測&驗證,確認恢復出來的數(shù)據(jù)完整有效。本次服務(wù)器數(shù)據(jù)恢復工作完成。
