服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
IBM某型號(hào)服務(wù)器中6塊硬盤搭建的raid5磁盤陣列,其中1塊盤作為熱備盤使用。
上層部署的是SAP應(yīng)用+Oracle數(shù)據(jù)庫(kù)。
服務(wù)器故障&檢測(cè):
服務(wù)器中RAID5磁盤陣列中的1塊盤出現(xiàn)故障離線,熱備盤激活替換離線硬盤,在進(jìn)行數(shù)據(jù)同步的過程中又有一塊硬盤故障離線,RAID5磁盤陣列癱瘓,上層LUN不可用,服務(wù)器崩潰。
IBM服務(wù)器中的LUN是基于RAID組的。分析故障raid5中的所有硬盤,發(fā)現(xiàn)其中一塊盤的數(shù)據(jù)同其它盤有明顯不同,初步判斷這塊盤就是HotSpare盤。分析其他盤以及Oracle數(shù)據(jù)庫(kù)頁(yè)在每個(gè)磁盤中的分布情況,獲取到該RAID5的條帶大小、磁盤順序及數(shù)據(jù)走向等RAID相關(guān)信息。利用獲取到的raid相關(guān)信息虛擬重構(gòu)RAID5,然后分析LUN在RAID5中的分配情況以及LUN分配的數(shù)據(jù)塊MAP。只需要將LUN的數(shù)據(jù)塊分布MAP提取出來,針對(duì)這些信息編寫相應(yīng)的程序,解析LUN的數(shù)據(jù)MAP,然后根據(jù)數(shù)據(jù)MAP導(dǎo)出LUN的數(shù)據(jù)即可恢復(fù)數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
一、恢復(fù)Oracle數(shù)據(jù)庫(kù)數(shù)據(jù)。
1、將包含Oracle數(shù)據(jù)庫(kù)數(shù)據(jù)的LUN進(jìn)行JFS2文件系統(tǒng)解析,人工修復(fù)文件系統(tǒng)的不完整部分。
2、利用北亞企安自主開發(fā)的JFS2文件系統(tǒng)解析工具解析修復(fù)完成的LUN,然后恢復(fù)文件系統(tǒng)中所有的Oracle數(shù)據(jù)庫(kù)文件。
3、檢測(cè)Oracle數(shù)據(jù)庫(kù)文件的完整性。針對(duì)檢測(cè)有壞塊的數(shù)據(jù)庫(kù)文件,通過掃描所有硬盤找到所有Oracle碎片,組合掃描到的數(shù)據(jù)頁(yè),人工將有壞塊的數(shù)據(jù)庫(kù)文件修復(fù)完整。
4、恢復(fù)完所有Oracle數(shù)據(jù)庫(kù)之后,發(fā)現(xiàn)SAP應(yīng)用還是無(wú)法正常使用。經(jīng)過分析發(fā)現(xiàn)SAP應(yīng)用的一些重要數(shù)據(jù)也是存放在損壞的存儲(chǔ)中,如果沒有這些重要的數(shù)據(jù),即使在Oracle數(shù)據(jù)庫(kù)完整的情況下SAP應(yīng)用也無(wú)法正常使用。
二、恢復(fù)SAP應(yīng)用數(shù)據(jù)。
1、對(duì)恢復(fù)出來的所有LUN都進(jìn)行文件系統(tǒng)解析,將包含SAP應(yīng)用數(shù)據(jù)的LUN進(jìn)行文件系統(tǒng)的一致性檢測(cè)。人工修復(fù)文件系統(tǒng)不完整部分,直至恢復(fù)出所有SAP及SAP Test的數(shù)據(jù)。
2、檢測(cè)恢復(fù)出來的SAP應(yīng)用數(shù)據(jù),對(duì)損壞的SAP應(yīng)用數(shù)據(jù)進(jìn)行修復(fù),直至所有SAP數(shù)據(jù)都完整,只有這樣才能保證SAP應(yīng)用能夠正常使用。
3、SAP數(shù)據(jù)修復(fù)完成后,結(jié)合之前恢復(fù)出來的Oracle數(shù)據(jù)庫(kù),即可啟動(dòng)SAP應(yīng)用了。
三、啟動(dòng)并修復(fù)Oracle數(shù)據(jù)庫(kù)及SAP應(yīng)用
1、啟動(dòng)數(shù)據(jù)庫(kù)并修復(fù)。
把恢復(fù)的Oracle數(shù)據(jù)庫(kù)文件還原到已搭建好的環(huán)境中,并嘗試啟動(dòng)Oracle數(shù)據(jù)庫(kù)。在啟動(dòng)過程中由于數(shù)據(jù)庫(kù)一些臨時(shí)文件的校驗(yàn)不一致導(dǎo)致數(shù)據(jù)庫(kù)啟動(dòng)失敗。聯(lián)系Oracle數(shù)據(jù)庫(kù)工程師對(duì)數(shù)據(jù)庫(kù)進(jìn)行修復(fù),修復(fù)完成后Oracle數(shù)據(jù)庫(kù)啟動(dòng)成功,經(jīng)過反復(fù)驗(yàn)證確認(rèn)數(shù)據(jù)庫(kù)中的所有用戶及所有表均完整,然后嘗試啟動(dòng)SAP。
2、啟動(dòng)SAP并修復(fù)。
將恢復(fù)出來的SAP數(shù)據(jù)還原到已搭建好的環(huán)境中并啟動(dòng)SAP,SAP啟動(dòng)正常,但SAP中的用戶權(quán)限及使用異常,SAP表現(xiàn)為沒有序列號(hào)。北亞企安數(shù)據(jù)恢復(fù)工程師初步判斷是因?yàn)镾AP的注冊(cè)文件沒有恢復(fù)出來。重新檢測(cè)恢復(fù)過程,排查可能疏忽的地方,結(jié)果發(fā)現(xiàn)確實(shí)因?yàn)槲募到y(tǒng)損壞導(dǎo)致某些文件沒有恢復(fù)出來。重新修復(fù)文件系統(tǒng)并恢復(fù)這些數(shù)據(jù),然后啟動(dòng)并檢查SAP,結(jié)果一切正常。
3、在用戶方工程師配合下啟動(dòng)服務(wù)器內(nèi)的Oracle數(shù)據(jù)庫(kù)和SAP,通過SAP客戶端反復(fù)驗(yàn)證SAP中所有的數(shù)據(jù),沒有發(fā)現(xiàn)任何問題,恢復(fù)出來的數(shù)據(jù)完整可用。本次數(shù)據(jù)恢復(fù)任務(wù)完成。
審核編輯:湯梓紅
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8979瀏覽量
85100 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
541瀏覽量
17346 -
磁盤
+關(guān)注
關(guān)注
1文章
365瀏覽量
25156 -
RAID5
+關(guān)注
關(guān)注
0文章
108瀏覽量
12703
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論