服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺某品牌存儲設(shè)備上有一組由10塊硬盤(9塊數(shù)據(jù)盤+1塊熱備盤)組建的raid5陣列,上層部署vmware exsi虛擬化平臺。
服務(wù)器故障:
raid5陣列中兩塊硬盤對應(yīng)的指示燈亮黃燈掉線。硬盤序列號無法讀取,通過SAS擴展卡也無法讀取。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將存儲中所有磁盤標(biāo)記后取出。將掉線的其中一塊故障盤連接到外部的SAS擴展卡上,加電后通過硬盤聲音判斷電機可以啟動,但是磁頭沒有進行尋道操作。硬件工程師將硬盤PCB分離下來清潔HDA組件氧化部分,清潔后故障依舊。和用戶方溝通并得到同意后,硬件工程師在無塵室將熱備盤的PCB替換到故障盤上,并將故障盤PCB上的ROM芯片替換到從熱備盤上取出的PCB上面。這時硬盤的電機起轉(zhuǎn)和磁頭尋道聲音正常,但是在尋道結(jié)束后,有明顯的敲盤聲音,基本上可以判斷磁頭損壞。和用戶方溝通后使用熱備盤中的磁頭替換故障盤上的磁頭,不幸的是這塊故障盤已經(jīng)無法識別,無法讀取數(shù)據(jù)。
再次和用戶方溝通后嘗試對另一塊故障盤進行修復(fù)。和第一塊故障盤一樣,這塊故障盤的磁頭損壞,通過各種渠道找到相同型號的硬盤并更換磁頭。更換磁頭后這塊故障盤能夠被正常識別,于是將這塊故障盤所有扇區(qū)以只讀方式做完整鏡像。其他完好硬盤也以只讀方式做扇區(qū)級全盤鏡像。鏡像完成后將所有磁盤按照原樣還原到存儲設(shè)備中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進行,避免對原始數(shù)據(jù)造成二次破壞。
2、判斷起始扇區(qū)。
所有硬盤鏡像完成后,使用工具打開9塊數(shù)據(jù)盤,9塊盤的0扇區(qū)都有“55 AA”標(biāo)志。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
0x01C2H處顯示“05”,表示這是一個擴展分區(qū)。從0扇區(qū)看這是一個不正常的MBR分區(qū)結(jié)構(gòu)。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
繼續(xù)往下找,在另外的2塊盤上找到了“55 AA”的標(biāo)志。其中一塊盤上是一個正常的MBR分區(qū),其0x01C6處數(shù)值代表指向的下一個扇區(qū)為GPT的頭部。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
另外一塊盤的0x01C6處數(shù)值表示指向下的一個扇區(qū)不是GPT的頭部。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
由此可以確定這2塊盤中其中一塊是第一塊盤,另外一塊盤可能是最后一塊盤。GPT分區(qū)所在扇區(qū)起始于172032扇區(qū),因此初步確定LUN的起始扇區(qū)是172032扇區(qū)。
3、判斷條帶(stripe)大小。
條帶也稱塊,是RAID處理數(shù)據(jù)的基本單元。不同RAID的條帶大小各不相同。RAID5的1個條帶組中有1個校驗區(qū),1個校驗區(qū)的大小等于1個條帶的大小。根據(jù)這個特征分析這個RAID5。如果對VMFS不熟悉,可以通過比較法確定條帶大小。如果某一條帶組中的校驗區(qū)和該條帶組中的非校驗區(qū)相差很明顯,通過工具查看并對比就可以找出條帶大小。北亞企安數(shù)據(jù)恢復(fù)工程師通過上述方法判斷出本案例中條帶大小是1024個扇區(qū)。
4、判斷RAID5陣列成員盤盤序。
按照1024扇區(qū)進行分割,使一個記錄為一個條帶的大小,9塊盤跳到同一記錄283123。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
當(dāng)9塊盤都定位到同一位置時,通過對比可以判斷校驗區(qū)的走向,繼而判斷整個RAID5的走向。將之前判斷出的第一塊盤放在第一個位置就可以判斷走向了。北亞企安數(shù)據(jù)恢復(fù)工程師通過上述方法判斷出本案例中raid5的走向和盤序。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
5、前面的步驟中已經(jīng)確定LUN的起始扇區(qū)是172032扇區(qū)。跳到172032扇區(qū)并觀察各硬盤的情況。如果172032扇區(qū)是LUN的起始扇區(qū),那么這個扇區(qū)所屬條帶中的那塊盤應(yīng)該是校驗區(qū),但是此條帶中卻顯示另外一塊盤是檢驗區(qū)。根據(jù)RAID5的左走向,172032扇區(qū)所屬條帶中的那塊盤的校驗區(qū)應(yīng)該在172032-1024=171008扇區(qū),即上一個條帶。跳轉(zhuǎn)到171008扇區(qū),卻發(fā)現(xiàn)校驗區(qū)為172032扇區(qū)所屬條帶顯示的另外一塊盤,因此可以確定LUN的起始扇區(qū)為171008扇區(qū)。
6、在工具中按照確定的盤序組織好磁盤并添加進去,選擇RAID5,Stripe size 512KB,左異步。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
點擊Build重組raid5。由于數(shù)據(jù)從1024*8=8192個扇區(qū)開始,若工具沒有跳轉(zhuǎn)到此扇區(qū)的功能,那么剛組好的RAID必須和一個文件再進行一次重組操作。RAID的起始扇區(qū)選擇8192,這個文件可以任意選擇起始扇區(qū)和大小。
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)—Raid5數(shù)據(jù)恢復(fù)
7、移交數(shù)據(jù)。RAID5重組完成后,聯(lián)系用戶方驗收數(shù)據(jù)。經(jīng)過驗證,用戶方確認數(shù)據(jù)沒有問題。根據(jù)用戶方要求把數(shù)據(jù)移交到用戶方帶來的新盤上。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8947瀏覽量
85065 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
537瀏覽量
17339 -
RAID5
+關(guān)注
關(guān)注
0文章
108瀏覽量
12698
發(fā)布評論請先 登錄
相關(guān)推薦
評論