服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境:
一臺EVA某型號控制器+EVA擴展柜+FC磁盤。
服務(wù)器存儲故障&檢測:
磁盤故障導(dǎo)致該EVA存儲中LUN不可用,導(dǎo)致上層應(yīng)用無法正常使用。
服務(wù)器存儲數(shù)據(jù)恢復(fù)過程:
1、將所有磁盤做好標(biāo)記后從擴展柜中取出。硬件工程師對所有磁盤做物理故障檢測,并沒有發(fā)現(xiàn)有磁盤存在物理故障。使用壞道檢測工具檢測也沒有發(fā)現(xiàn)有磁盤存在大量壞道。以只讀方式將所有硬盤進行扇區(qū)級全盤鏡像。鏡像完成后將所有磁盤按照原樣還原到原擴展柜中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析所有磁盤底層文件。由于沒有檢測到有磁盤存在物理故障或者大量壞道,由此推斷故障是由于磁盤讀寫不穩(wěn)定引起的。EVA控制器通常會將讀寫性能不穩(wěn)定的磁盤認(rèn)定為壞盤并踢出磁盤組。一旦某個LUN的同一個條帶中的掉盤數(shù)量到達極限,這個LUN將變得不可用。EVA存儲中包含這些掉線盤的LUN都會受影響。部分磁盤出現(xiàn)故障可能會導(dǎo)致整個存儲無法正常使用。
3、EVA存儲的LUN都是以RAID條目的形式存放數(shù)據(jù)的,EVA存儲將每個磁盤的不同塊組成一個RAID條目。RAID條目的類型可以有很多種,在恢復(fù)數(shù)據(jù)之前需要分析出組成LUN的RAID條目類型以及RAID條目是由哪些盤的哪些塊所組成。這些信息都存放在LUN_MAP中,每個LUN都有一份LUN_MAP。EVA存儲將LUN_MAP分別存放在不同的磁盤中,使用一個索引來指定其位置。在每個磁盤中找這個指向LUN_MAP的索引就可以找到現(xiàn)存LUN的信息了。
4、脫離EVA磁盤組的磁盤中存放一些舊的數(shù)據(jù),在生成數(shù)據(jù)的時候需要將這些磁盤都排除掉。由于本案例LUN中RAID都是RAID5陣列,只需要將一個LUN的RAID條目通過RAID5的校驗算法算出校驗值,再和原校驗值做比較就可以判斷這個條目中是否有掉線盤。將一個LUN的所有LUN_MAP都校驗一遍就可以知道這個LUN中哪些RAID條目中有掉線盤。在這些RAID條目中都存在的那塊磁盤一定就是掉線盤。排除掉線盤,根據(jù)LUN_MAP恢復(fù)所有LUN的數(shù)據(jù)即可。
5、北亞企安數(shù)據(jù)恢復(fù)工程師編寫掃描LUN_MAP的程序掃描全部LUN_MAP,結(jié)合人工分析得出最精確的LUN_MAP。編寫檢測RAID條目的程序檢測所有LUN中掉線的磁盤,結(jié)合人工分析排除掉線的磁盤。編寫LUN數(shù)據(jù)恢復(fù)程序,結(jié)合LUN_MAP恢復(fù)所有LUN數(shù)據(jù)。
6、恢復(fù)出所有LUN的數(shù)據(jù)后人工核對每個LUN,確認(rèn)是否和用戶方描述的一致。
恢復(fù)出來的部分LUN數(shù)據(jù):
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
7、分析恢復(fù)出來的LUN,重組ASM磁盤組,解析ASM磁盤組。
分析每個LUN前端的結(jié)構(gòu)數(shù)據(jù),根據(jù)ASM磁盤組結(jié)構(gòu)來區(qū)分哪些LUN是屬于ASM磁盤組的。分析后發(fā)現(xiàn)共有2套ASM磁盤組。
每個磁盤組包含的LUN中的分區(qū)的情況:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
使用ASM結(jié)構(gòu)解析工具解析和修復(fù)每個磁盤組,解析出ASM磁盤組中存放的所有數(shù)據(jù)庫文件。
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
8、分別按照文件類型分組導(dǎo)出解析出的數(shù)據(jù)庫文件&初步檢測導(dǎo)出的文件。
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
9、根據(jù)用戶方的描述,所有LUN的數(shù)據(jù)分成兩部分:一部分是Vmware的虛擬機;一部分是ORACLE上的ASM磁盤組數(shù)據(jù),ASM磁盤組中存放的是Oracle的dbf數(shù)據(jù)庫文件。人工核對哪些LUN是存放Vmware數(shù)據(jù),哪些LUN是存放ASM磁盤組數(shù)據(jù),然后將LUN掛載到不同的驗證環(huán)境中驗證恢復(fù)的數(shù)據(jù)是否完整。
10、將所有符合vmware虛擬機的LUN里面的虛擬機文件都生成出來,然后通過NFS共享的方式掛載到虛擬主機上,再將虛擬機一個一個的添加到清單。
恢復(fù)的部分虛擬機文件:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
11、通過NFS將所有虛擬機都添加到虛擬主機以后,將所有虛擬機都加電開機,系統(tǒng)都能正常啟動。驗證虛擬機里面的數(shù)據(jù)都沒有問題。
部分虛擬機:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
12、根據(jù)甲方工程師提供的環(huán)境信息搭載Oracle數(shù)據(jù)庫驗證環(huán)境。
a. 環(huán)境檢測
# uname -all
然后檢查各部分存儲空間信息,保證空間足夠。
b. 檢測安裝依賴包
根據(jù)安裝說明“ b19068.pdf ”,檢查 oracle10g 所需的補丁包。
檢測:
# swlist-l bundle |grep "GOLD"
# swlist-l patch |grep PHNE_31097
如果沒有檢測到的,需要到官方網(wǎng)站下載并安裝。 安裝補丁包:
swinstall -s /patchCD/GOLDQPK11i -x autoreboot=true -x patch_match_target=true
c. 創(chuàng)建用戶及組
#groupadd dba
#useradd -g dba -d /home/oracle oracle/frombyte
#passwd oracle
d. 創(chuàng)建目錄并修改權(quán)限
創(chuàng)建目錄:
#mkdir –p/opt/oracle/product/10.2/oracledb/
#chown -R oracle:dba/opt/oracle
修改權(quán)限:
#chown oracle:dba/usr/oracle_inst/database/frombyte.com
#chmod 755/usr/oracle_inst/database/frombyte.com
e. 設(shè)置環(huán)境變量
vi /home/oracle/.profile
f. 安裝oracle
Oracle的安裝要求起圖形界面,所以要先測試圖像界面能正常啟動。
#exoprt DISPLAY=192.168.0.1.0:0
$./runInstaller
圖像界面起來之后,先只安裝軟件,不安裝實例。
g. 測試數(shù)據(jù)庫連接
#su - oracle
$sqlplus / as syssdba
13、通過oracle官方檢測工具DBV對導(dǎo)出的數(shù)據(jù)文件進行物理結(jié)構(gòu)檢測。
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
經(jīng)過驗證,確認(rèn)所有文件結(jié)構(gòu)正確,沒有結(jié)構(gòu)性損壞。
14、因為原來數(shù)據(jù)庫實例有2個且使用的ASM存儲,所以要按照原來配置和命名創(chuàng)建數(shù)據(jù)庫實例。修改控制文件中的路徑,讓oracle識別到這些數(shù)據(jù)庫數(shù)據(jù)文件,然后啟動數(shù)據(jù)庫。
dmis數(shù)據(jù)庫啟動截圖:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
gsm數(shù)據(jù)庫啟動截圖:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
整個啟動過程正常,沒有任何報錯,基本上可以判斷數(shù)據(jù)庫恢復(fù)完好。
15、驗證所有數(shù)據(jù)沒有問題后,將vmware虛擬機文件和Oracle數(shù)據(jù)庫文件拷貝至兩塊硬盤中,然后移交給用戶方。
用戶方將數(shù)據(jù)上傳至后臺,經(jīng)過檢測,程序可正常運行。用戶方認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。
運行情況:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
運行規(guī)定:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
運行變更摘要:
北亞企安數(shù)據(jù)恢復(fù)—EVA存儲數(shù)據(jù)恢復(fù)
審核編輯 黃宇
-
存儲
+關(guān)注
關(guān)注
13文章
4231瀏覽量
85591 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8973瀏覽量
85098 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
540瀏覽量
17346
發(fā)布評論請先 登錄
相關(guān)推薦
評論