服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)采用zfs文件系統(tǒng)的服務(wù)器,配備32塊硬盤(pán)。
服務(wù)器故障:
服務(wù)器在運(yùn)行過(guò)程中崩潰,經(jīng)過(guò)初步檢測(cè)沒(méi)有發(fā)現(xiàn)服務(wù)器有物理故障,重啟服務(wù)器后故障依舊,用戶聯(lián)系我們中心要求恢復(fù)服務(wù)器數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、服務(wù)器數(shù)據(jù)恢復(fù)工程師對(duì)故障服務(wù)器中所有硬盤(pán)進(jìn)行了扇區(qū)級(jí)鏡像備份,后續(xù)的數(shù)據(jù)恢復(fù)操作都在鏡像文件上進(jìn)行,避免了可能對(duì)原始數(shù)據(jù)造成的二次破壞。
2、通過(guò)對(duì)鏡像文件的分析,服務(wù)器數(shù)據(jù)恢復(fù)工程師獲取關(guān)于故障服務(wù)器一些信息:服務(wù)器操作系統(tǒng)采用的zfs文件系統(tǒng),總共組建了4組raidz。4組raidz中的2組raidz的熱備盤(pán)已經(jīng)啟用,其中第一組啟用了1塊熱備盤(pán),第二組啟用了3塊熱備盤(pán)。第一組啟動(dòng)了一塊熱備盤(pán)后又有一塊正常硬盤(pán)掉線,第二組中有2塊硬盤(pán)掉線。
兩組raidz均在有硬盤(pán)離線的情況下啟用了熱備盤(pán)進(jìn)行了壞盤(pán)的替換,熱備盤(pán)上線后第這兩組raidz又有其他的硬盤(pán)離線。zpool在每次讀取數(shù)據(jù)時(shí)候都需要進(jìn)行校驗(yàn)獲取到正確數(shù)據(jù),緊接著第二組raidz又有硬盤(pán)離線,服務(wù)器因此崩潰。
3、重組ZPOOL,追蹤數(shù)據(jù)入口。zfs文件系統(tǒng)管理的存儲(chǔ)池與常規(guī)存儲(chǔ)不同,所有磁盤(pán)都由ZFS進(jìn)行管理。常規(guī)RAID在存儲(chǔ)數(shù)據(jù)時(shí),只按照特定的規(guī)則組建池,不關(guān)心文件在子設(shè)備上的位置。而ZFS在數(shù)據(jù)存儲(chǔ)時(shí)會(huì)為每次寫(xiě)入的數(shù)據(jù)分配適當(dāng)大小的空間,并計(jì)算得到指向子設(shè)備的數(shù)據(jù)指針。ZFS這種特性使得RAIDZ缺盤(pán)時(shí)無(wú)法直接通過(guò)校驗(yàn)獲取到數(shù)據(jù),必須將整個(gè)ZPOOL作為一個(gè)整體進(jìn)行解析。
4、手工截取事務(wù)塊數(shù)據(jù),北亞數(shù)據(jù)恢復(fù)工程師編寫(xiě)程序獲取最大事務(wù)號(hào)入口:
北亞數(shù)據(jù)恢復(fù)——zfs文件系統(tǒng)數(shù)據(jù)恢復(fù)
獲取文件系統(tǒng)入口
5、獲取到文件系統(tǒng)入口后,北亞數(shù)據(jù)恢復(fù)工程師編寫(xiě)數(shù)據(jù)指針解析程序解析地址:
北亞數(shù)據(jù)恢復(fù)——zfs文件系統(tǒng)數(shù)據(jù)恢復(fù)
解析數(shù)據(jù)指針
6、獲取到文件系統(tǒng)入口點(diǎn)在各磁盤(pán)的分布情況后,北亞數(shù)據(jù)恢復(fù)工程師手工截取并分析文件系統(tǒng)內(nèi)部結(jié)構(gòu),發(fā)現(xiàn)入口分布所在的磁盤(pán)組無(wú)缺失盤(pán),可直接提取信息。根據(jù)ZFS文件系統(tǒng)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)順利找到映射的LUN名稱,最終找到其節(jié)點(diǎn)。
7、經(jīng)過(guò)分析發(fā)現(xiàn)在此故障服務(wù)器采用的ZFS文件系統(tǒng)版本與開(kāi)源版本有較大差別,北亞數(shù)據(jù)恢復(fù)工程師重新編寫(xiě)了數(shù)據(jù)提取程序。由于磁盤(pán)組內(nèi)缺盤(pán)數(shù)目比較多,每個(gè)IO流都需要通過(guò)校驗(yàn)得到,提取進(jìn)度極為緩慢。
北亞數(shù)據(jù)恢復(fù)——zfs文件系統(tǒng)數(shù)據(jù)恢復(fù)
8、與用戶溝通得知ZVOL卷映射到XenServer作為存儲(chǔ)設(shè)備,用戶所需的文件在其中一個(gè)大小約為2T的vhd內(nèi)。提取ZVOL卷頭部信息,按照XenStore卷存儲(chǔ)結(jié)構(gòu)進(jìn)行分析后發(fā)現(xiàn)這個(gè)2T的vhd在整個(gè)卷的尾部,通過(guò)計(jì)算找到這個(gè)2T的vhd的起始位置,然后從此位置開(kāi)始提取數(shù)據(jù)。
9、Vhd提取完畢后對(duì)其內(nèi)部的壓縮包、圖片、視頻等文件進(jìn)行驗(yàn)證,均可正常打開(kāi)。讓用戶親自驗(yàn)證數(shù)據(jù),結(jié)果發(fā)現(xiàn)恢復(fù)出來(lái)的文件數(shù)量與系統(tǒng)自動(dòng)記錄的文件數(shù)量幾乎相同,丟失的極小數(shù)量的文件可能是因?yàn)槭?a href="http://ttokpm.com/article/zt/" target="_blank">最新生成還未刷新到磁盤(pán)。文件全部可正常打開(kāi),本次數(shù)據(jù)恢復(fù)完成。
審核編輯:湯梓紅
-
硬盤(pán)
+關(guān)注
關(guān)注
3文章
1283瀏覽量
57199 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8963瀏覽量
85087 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
539瀏覽量
17345
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論