服務器存儲數(shù)據(jù)恢復環(huán)境:
一臺EMC存儲中有一組raid5磁盤陣列,劃分1個lun供小型機使用,上層采用ZFS文件系統(tǒng)。
服務器存儲故障:
一臺有一組raid5磁盤陣列的存儲在運行過程中突然崩潰。管理員檢查發(fā)現(xiàn)存儲中的raid5陣列有兩塊硬盤離線,該陣列中的兩塊熱備盤只有一塊熱備盤激活成功,raid5陣列癱瘓,存儲不可用。
服務器存儲數(shù)據(jù)恢復過程:
1、將故障raid中所有磁盤編號后取出。硬件工程師首先對raid中兩塊離線硬盤進行物理檢測,硬盤無物理故障,無壞道。其他硬盤經(jīng)過檢測也沒有發(fā)現(xiàn)物理故障和壞道。
以只讀方式將所有磁盤進行扇區(qū)級的全盤鏡像,鏡像完成后將所有磁盤按照編號還原到原存儲中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
將備份數(shù)據(jù)的520字節(jié)扇區(qū)轉(zhuǎn)換為512字節(jié)扇區(qū),以方便操作。
2、基于鏡像文件分析所有硬盤的底層數(shù)據(jù),獲取原RAID5陣列的相關信息,并找到最先掉線的那塊硬盤。根據(jù)這些信息重組原RAID。
3、通過重組的raid分析lun的分配情況和數(shù)據(jù)塊,使用北亞企安自主開發(fā)軟件提取lun數(shù)據(jù),然后對提取出來的lun進行文件系統(tǒng)解析操作。正常情況下解析完成即可恢復數(shù)據(jù),但解析文件系統(tǒng)報錯。
4、服務器數(shù)據(jù)恢復工程師檢查文件發(fā)現(xiàn)ZFS文件系統(tǒng)的部分元文件損壞導致了文件系統(tǒng)無法解析。需要對損壞的ZFS文件系統(tǒng)元文件進行修復后才能正常解析ZFS文件系統(tǒng)。
5、經(jīng)過分析發(fā)現(xiàn),ZFS文件系統(tǒng)正在進行IO操作的時候存儲癱瘓,導致部分元文件沒有更新以及部分元文件損壞。人工修復這些損壞的元文件,直到ZFS文件系統(tǒng)能夠正常解析。
6、對修復好的ZFS文件系統(tǒng)做解析,解析所有文件節(jié)點及目錄結(jié)構(gòu)。解析完成后導出raid陣列所有數(shù)據(jù)。
7、經(jīng)過用戶方的仔細檢測,確認恢復出來的數(shù)據(jù)完整可用。本次數(shù)據(jù)恢復工作完成。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
8958瀏覽量
85082 -
數(shù)據(jù)恢復
+關注
關注
10文章
538瀏覽量
17341 -
RAID5
+關注
關注
0文章
108瀏覽量
12700
發(fā)布評論請先 登錄
相關推薦
評論