服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
昆騰某型號存儲,StorNext文件存儲系統(tǒng)。
共有9個分別配置了24塊磁盤的磁盤柜,其中8個磁盤柜存放普通數(shù)據(jù),1個磁盤柜存放元數(shù)據(jù)。
存放元數(shù)據(jù)的磁盤柜中的24塊磁盤組建了8組RAID1陣列和1組4盤RAID10陣列,還有4個全局熱備硬盤。
存放普通數(shù)據(jù)的磁盤柜中的192塊磁盤共組建了32組6盤RAID5陣列,32組RAID5陣列分為2個存儲系統(tǒng)。
服務(wù)器故障:
存放普通數(shù)據(jù)的其中一個存儲系統(tǒng)中的一組RAID5陣列有2塊硬盤先后出現(xiàn)故障離線,該RAID5陣列不可用,從而導(dǎo)致該陣列所在的存儲系統(tǒng)崩潰,無法使用。
昆騰存儲及StorNext文件系統(tǒng)架構(gòu):
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
注:Meta_LUN(元數(shù)據(jù)卷)) Data_LUN(用戶數(shù)據(jù)卷)
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將磁盤柜中出現(xiàn)故障的raid5陣列中的所有磁盤編號后取出,由硬件工程師進(jìn)行檢測,除了發(fā)現(xiàn)其中一塊離線硬盤存在大量的壞道,沒有發(fā)現(xiàn)其他磁盤存在明顯的硬件故障。將完好的硬盤以只讀方式進(jìn)行扇區(qū)級的全盤鏡像,鏡像完成后將所有磁盤按照編號還原到原磁盤柜中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
針對存在大量的壞道的磁盤,由硬件工程師開盤更換固件,更換固件能正常讀取后使用專業(yè)工具進(jìn)行修復(fù),雖然壞道仍然存在,但是可以備份。
部分鏡像文件:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
2、基于鏡像文件對故障RAID5陣列底層數(shù)據(jù)進(jìn)行分析,獲取到該RAID5相關(guān)信息,利用獲取到的信息虛擬重組RAID5陣列,重組完成后將RAID5陣列中的LUN恢復(fù)成鏡像文件。在分析過程中,發(fā)現(xiàn)損壞較嚴(yán)重的硬盤為后離線的硬盤,就是此硬盤存在大量壞道。
3、登錄昆騰存儲設(shè)備的管理界面,獲取到StorNext文件系統(tǒng)中和卷相關(guān)的一些基本信息。
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
4、分析StorNext文件系統(tǒng)中的Meta卷和Data卷,經(jīng)過分析發(fā)現(xiàn)該StorNext文件系統(tǒng)包含2個Data卷,每一個完整的Data卷是由多組RAID陣列中的LUN組成的,通過分析這些LUN,北亞企安數(shù)據(jù)恢復(fù)工程師研究出LUN之間組合的算法規(guī)律,然后虛擬重組出完整的Data卷。
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
5、分析Meta卷中的節(jié)點信息、目錄項信息、Meta卷和Data卷之間的對應(yīng)關(guān)系,針對一個Meta卷管理多個Data卷的情況,北亞企安數(shù)據(jù)恢復(fù)工程師研究出Meta卷到Data卷的索引算法。
文件節(jié)點:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
目錄塊:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
6、通過上述步驟的分析&研究,獲取到了數(shù)據(jù)恢復(fù)工作所需要的全部信息。北亞企安數(shù)據(jù)恢復(fù)工程師編寫程序掃描Meta卷中的節(jié)點信息和目錄項信息,通過解析目錄項和節(jié)點獲取完整的文件系統(tǒng)目錄結(jié)構(gòu)。解析每一個節(jié)點中的指針信息并將這些信息記錄在數(shù)據(jù)庫中。
文件信息:
北亞企安數(shù)據(jù)恢復(fù)——StorNext文件系統(tǒng)數(shù)據(jù)恢復(fù)
7、北亞企安數(shù)據(jù)恢復(fù)工程師編寫文件提取程序讀取數(shù)據(jù)庫,根據(jù)解析出的信息以及兩個Data卷之間的聚合算法提取數(shù)據(jù)。
8、隨機(jī)抽樣檢測提取出來的數(shù)據(jù),沒有發(fā)現(xiàn)任何問題。由用戶方工程師對恢復(fù)出來的數(shù)據(jù)進(jìn)行驗證,驗證完成后用戶方認(rèn)可恢復(fù)結(jié)果。
9、將恢復(fù)出來的數(shù)據(jù)遷移到用戶方準(zhǔn)備好的環(huán)境中,再次驗證沒有問題。本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯:湯梓紅
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8704瀏覽量
84580 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
507瀏覽量
17212 -
RAID5
+關(guān)注
關(guān)注
0文章
103瀏覽量
12680
發(fā)布評論請先 登錄
相關(guān)推薦
評論