服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
昆騰某型號(hào)存儲(chǔ),8個(gè)存放數(shù)據(jù)的存儲(chǔ)柜+1個(gè)存放元數(shù)據(jù)的存儲(chǔ)柜。
元數(shù)據(jù)存儲(chǔ):8組RAID1陣列+1組RAID10陣列+4個(gè)全局熱備硬盤。
數(shù)據(jù)存儲(chǔ):32組RAID5陣列,劃分2個(gè)存儲(chǔ)系統(tǒng)。
服務(wù)器故障:
數(shù)據(jù)存儲(chǔ)的1個(gè)存儲(chǔ)系統(tǒng)中的一組RAID5陣列中有2塊硬盤先后出現(xiàn)故障離線,導(dǎo)致該RAID5陣列失效,整個(gè)存儲(chǔ)系統(tǒng)崩潰不可用。
本案例存儲(chǔ)及文件系統(tǒng)架構(gòu)如下:
北亞企安數(shù)據(jù)恢復(fù)——StorNext數(shù)據(jù)恢復(fù)
注:Meta_LUN(元數(shù)據(jù)卷) Data_LUN(用戶數(shù)據(jù)卷)
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障RAID5陣列中的所有成員盤編號(hào)后從存儲(chǔ)柜中取出,經(jīng)過初步檢測(cè)都可以正常讀取。以只讀方式將所有磁盤進(jìn)行扇區(qū)級(jí)全盤鏡像,在鏡像過程中發(fā)現(xiàn)故障RAID5陣列中有1塊故障硬盤存在大量的壞道區(qū)域,無法完成鏡像。硬件工程師對(duì)故障硬盤進(jìn)行開盤并更換固件,使用專業(yè)工具進(jìn)行修復(fù)后可以繼續(xù)鏡像,但壞道仍然存在。鏡像完成后將所有磁盤按照編號(hào)還原到原存儲(chǔ)柜中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。針對(duì)沒有故障的RAID陣列,進(jìn)行存儲(chǔ)層面的備份。
部分鏡像文件:
北亞企安數(shù)據(jù)恢復(fù)——StorNext數(shù)據(jù)恢復(fù)
2、基于鏡像文件分析故障RAID5陣列中所有磁盤的的底層數(shù)據(jù),獲取到故障RAID的相關(guān)信息,利用獲取到的raid信息虛擬重組原RAID5陣列,將RAID中的LUN生成鏡像文件。通過分析底層數(shù)據(jù),確定那塊發(fā)現(xiàn)大量壞道的硬盤為后離線的硬盤,由于此硬盤存在大量壞道,可能對(duì)恢復(fù)結(jié)果造成影響。
3、登錄該昆騰存儲(chǔ)的管理界面,獲取到StorNext文件系統(tǒng)中與卷相關(guān)的一些基本信息。
北亞企安數(shù)據(jù)恢復(fù)——StorNext數(shù)據(jù)恢復(fù)
4、繼續(xù)分析StorNext文件系統(tǒng)中的Meta卷和Data卷。StorNext文件系統(tǒng)中包含2個(gè)Data卷,每一個(gè)Data卷都是由多組RAID中的LUN組成的。分析這些LUN獲取到這些LUN之間組合的算法規(guī)律,北亞企安數(shù)據(jù)恢復(fù)工程師利用得到的算法規(guī)律編寫程序虛擬重組完整的Data卷。
北亞企安數(shù)據(jù)恢復(fù)——StorNext數(shù)據(jù)恢復(fù)
5、分析Meta卷中的節(jié)點(diǎn)信息和目錄項(xiàng)信息,分析Meta卷和Data卷之間的對(duì)應(yīng)關(guān)系,針對(duì)一個(gè)Meta卷管理多個(gè)Data卷的情況,分析Meta卷到Data卷的索引算法。
文件節(jié)點(diǎn):
北亞企安數(shù)據(jù)恢復(fù)——StorNext數(shù)據(jù)恢復(fù)
目錄塊:
北亞企安數(shù)據(jù)恢復(fù)——StorNext數(shù)據(jù)恢復(fù)
6、通過上面的分析&研究,獲取到了恢復(fù)數(shù)據(jù)所需要的全部信息。北亞企安數(shù)據(jù)恢復(fù)工程師編寫程序掃描Meta卷中的節(jié)點(diǎn)信息和目錄項(xiàng)信息,然后通過解析目錄項(xiàng)和節(jié)點(diǎn)獲取完整的文件系統(tǒng)目錄結(jié)構(gòu)。解析每一個(gè)節(jié)點(diǎn)中的指針信息,將這些信息記錄在數(shù)據(jù)庫中。
文件信息:
北亞企安數(shù)據(jù)恢復(fù)——StorNext數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)工程師編寫文件提取程序讀取數(shù)據(jù)庫,根據(jù)解析出的信息以及兩個(gè)Data卷之間的聚合算法提取數(shù)據(jù)。
7、對(duì)提取出來的數(shù)據(jù)進(jìn)行隨機(jī)抽樣檢測(cè),沒有發(fā)現(xiàn)問題。將用戶方所需要的文件提取到本地后移交數(shù)據(jù)。
8、數(shù)據(jù)移交完成后,經(jīng)過檢測(cè)后,用戶方認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。雖然有raid5陣列中的一塊硬盤存在大量壞道,但核心數(shù)據(jù)沒有被破壞。本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8958瀏覽量
85082 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
538瀏覽量
17341 -
存儲(chǔ)系統(tǒng)
+關(guān)注
關(guān)注
2文章
402瀏覽量
40823 -
RAID5
+關(guān)注
關(guān)注
0文章
108瀏覽量
12700
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論