0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【服務(wù)器數(shù)據(jù)恢復(fù)】新網(wǎng)郵件服務(wù)器RAID5兩塊盤(pán)先后離線導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來(lái)源:Frombyte ? 作者:Frombyte ? 2022-10-31 12:00 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:

新網(wǎng)企業(yè)郵件服務(wù)器;

組建RAID5,文件系統(tǒng)為REISERFS;

一個(gè)數(shù)據(jù)分區(qū),存放上百萬(wàn)企業(yè)用戶的郵件。

服務(wù)器故障&分析:

服務(wù)器在正常運(yùn)行過(guò)程中,RAID突然OFFLINE。管理員檢查發(fā)現(xiàn)故障服務(wù)器有兩塊盤(pán)報(bào)警,將其中一塊盤(pán)強(qiáng)制上線后卻發(fā)現(xiàn)卷無(wú)法掛載,于是執(zhí)行FSCK并REBULD TREE,完成上述操作后卷仍然無(wú)法掛載。咨詢多家數(shù)據(jù)恢復(fù)服務(wù)商均無(wú)法提供可行的解決方案,最終新網(wǎng)選擇我們數(shù)據(jù)恢復(fù)中心進(jìn)行數(shù)據(jù)恢復(fù)。

這種RAID故障在我們數(shù)據(jù)恢復(fù)中心接到的cases中是很常見(jiàn)的。因?yàn)閳?bào)警的兩塊盤(pán)并不是同時(shí)掉線,如果強(qiáng)制上線先離線的硬盤(pán)會(huì)導(dǎo)致數(shù)據(jù)區(qū)的新舊數(shù)據(jù)混在一起,文件系統(tǒng)結(jié)構(gòu)不一致。強(qiáng)制上線會(huì)在讀寫(xiě)過(guò)程中生成新的檢驗(yàn)條帶,會(huì)影響一部分?jǐn)?shù)據(jù)。如果讀寫(xiě)不多或根本無(wú)法MOUNT,情況的嚴(yán)重性會(huì)小很多。

本案例中最嚴(yán)重的問(wèn)題在于REBUILD TREE,此操作相當(dāng)于將一個(gè)混雜的文件系統(tǒng)連續(xù)化,結(jié)果會(huì)導(dǎo)致文件系統(tǒng)的所有結(jié)構(gòu)體全面出錯(cuò),這種情況通常是無(wú)法挽救的。加上用戶的文件目錄結(jié)構(gòu)非常復(fù)雜,文件總數(shù)粗略估計(jì)上億,恢復(fù)數(shù)據(jù)的機(jī)會(huì)很小。

服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:

1、首先對(duì)故障服務(wù)器所有硬盤(pán)做鏡像備份,后續(xù)的數(shù)據(jù)恢復(fù)操作都在備份文件上進(jìn)行,避免對(duì)數(shù)據(jù)二次破壞。

2、服務(wù)器數(shù)據(jù)恢復(fù)工程師先試圖將文件系統(tǒng)結(jié)構(gòu)區(qū)單獨(dú)提出來(lái)進(jìn)行分析,但REISERFS文件系統(tǒng)區(qū)相對(duì)分散且無(wú)規(guī)律,通過(guò)北亞自主研發(fā)的程序?qū)ξ募到y(tǒng)結(jié)構(gòu)區(qū)進(jìn)行提取和分析。在本案例中,僅1級(jí)節(jié)點(diǎn)提取出來(lái)的數(shù)據(jù)就有好幾個(gè)G,可見(jiàn)本案例文件結(jié)構(gòu)的復(fù)雜。

3、對(duì)文件系統(tǒng)區(qū)進(jìn)行一致性檢驗(yàn),修正錯(cuò)誤地方。本案例中好多文件系統(tǒng)節(jié)點(diǎn)區(qū)都因檢驗(yàn)關(guān)系,使關(guān)鍵屬性字節(jié)發(fā)生了改變。通過(guò)北亞自主研發(fā)的程序?qū)⑺泄?jié)點(diǎn)狀態(tài)統(tǒng)一初始化,對(duì)節(jié)點(diǎn)進(jìn)行一致性處理。

4、完成上述兩步操作后有2種方案恢復(fù)最終的數(shù)據(jù):

第一種方案:在LINUX系統(tǒng)下再次執(zhí)行FSCK,結(jié)果實(shí)施這種方案后發(fā)現(xiàn)效果不好,原因是LINUX FSCK的功能有限,如果在父節(jié)點(diǎn)稍有錯(cuò)誤,其子節(jié)點(diǎn)便會(huì)被全部打入到LOST+FOUND里,無(wú)法還原原本的目錄結(jié)構(gòu)。

第二種方案:通過(guò)只讀方式,在WINDOWS環(huán)境下用北亞自主研發(fā)的程序提取數(shù)據(jù)。在具體的實(shí)施過(guò)程中,需要不斷修改程序并忽略一些錯(cuò)誤,最終提取出數(shù)據(jù)。

5、由用戶對(duì)恢復(fù)出來(lái)的數(shù)據(jù)進(jìn)行檢測(cè),確認(rèn)需要的數(shù)據(jù)基本都恢復(fù)出來(lái),可以正常讀取。

服務(wù)器數(shù)據(jù)恢復(fù)總結(jié):

RAID5磁盤(pán)陣列兩塊硬盤(pán)先后離線,但是又不知道離線先后順序的case很多。碰到這種情況需要我們謹(jǐn)慎處理。如果可以查詢到日志,通過(guò)日志確定為好。如果強(qiáng)制上線出錯(cuò),應(yīng)馬上停止操作,切不可做FSCK等操作。

LINUX的FSCK操作風(fēng)險(xiǎn)很大,做之前一定要看清楚提示,如果出錯(cuò)信息異常,應(yīng)選擇其他方案。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8732

    瀏覽量

    84620
  • RAID
    +關(guān)注

    關(guān)注

    0

    文章

    263

    瀏覽量

    34984
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    509

    瀏覽量

    17236
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤(pán)上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器磁盤(pán)陣列數(shù)據(jù)恢復(fù)環(huán)境: 服務(wù)器中有組分別由4
    的頭像 發(fā)表于 09-19 11:01 ?129次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>熱備盤(pán)上線同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤(pán)未全部成功啟用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)EMC某型號(hào)存儲(chǔ)中有一組RAID5磁盤(pán)陣列。該raid5
    的頭像 發(fā)表于 08-14 11:27 ?269次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>熱備<b class='flag-5'>盤(pán)</b>未全部成功啟用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤(pán)未完全激活導(dǎo)致陣列崩潰數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 北京某企業(yè)一臺(tái)EMC FCAX-4存儲(chǔ)上搭建一組由12成員盤(pán)raid5
    的頭像 發(fā)表于 07-12 10:58 ?211次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中raid5陣列硬盤(pán)離線數(shù)據(jù)恢復(fù)案例

    突然崩潰。管理員檢查發(fā)現(xiàn)存儲(chǔ)中的raid5陣列兩塊硬盤(pán)離線,該陣列中的
    的頭像 發(fā)表于 07-09 11:58 ?140次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤(pán)壞道導(dǎo)致raid崩潰數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 某單位一臺(tái)某品牌DS5300存儲(chǔ),1個(gè)機(jī)頭+4個(gè)擴(kuò)展柜,50硬盤(pán)組建2組RAID5磁盤(pán)
    的頭像 發(fā)表于 07-05 12:00 ?324次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—磁盤(pán)不穩(wěn)定被踢導(dǎo)致raid5陣列崩潰數(shù)據(jù)恢復(fù)案例

    管理,存放的數(shù)據(jù)主要為Oracle數(shù)據(jù)庫(kù)及OA服務(wù)端。 服務(wù)器存儲(chǔ)故障: 服務(wù)器存儲(chǔ)raid5
    的頭像 發(fā)表于 06-12 11:30 ?221次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—磁盤(pán)不穩(wěn)定被踢<b class='flag-5'>導(dǎo)致</b><b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤(pán)離線且熱備盤(pán)未激活的數(shù)據(jù)恢復(fù)案例

    raid5陣列兩塊硬盤(pán)由于未知故障離線,服務(wù)器數(shù)據(jù)丟失。北亞企安
    的頭像 發(fā)表于 06-06 17:07 ?302次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>硬盤(pán)<b class='flag-5'>離線</b>且熱備<b class='flag-5'>盤(pán)</b>未激活的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—X3650服務(wù)器raid5磁盤(pán)陣列數(shù)據(jù)恢復(fù)案例

    一臺(tái)某品牌X3650M3服務(wù)器,服務(wù)器中有一組raid5磁盤(pán)陣列,上層采用zfs文件系統(tǒng)。 服務(wù)器未知原因
    的頭像 發(fā)表于 06-04 11:08 ?363次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5磁盤(pán)掉線導(dǎo)致崩潰數(shù)據(jù)恢復(fù)案例

    某公司的一臺(tái)服務(wù)器中的raid5磁盤(pán)陣列兩塊磁盤(pán)先后掉線,服務(wù)器
    的頭像 發(fā)表于 05-21 11:43 ?544次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b>多<b class='flag-5'>塊</b>磁盤(pán)掉線<b class='flag-5'>導(dǎo)致</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5陣列兩塊盤(pán)出現(xiàn)物理故障離線數(shù)據(jù)恢復(fù)案例

    服務(wù)器中有一組由多硬盤(pán)組建的raid5磁盤(pán)陣列,服務(wù)器陣列中2
    的頭像 發(fā)表于 05-09 14:02 ?178次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b><b class='flag-5'>兩塊</b><b class='flag-5'>盤(pán)</b>出現(xiàn)物理故障<b class='flag-5'>離線</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—分享幾個(gè)服務(wù)器數(shù)據(jù)恢復(fù)的案例

    服務(wù)器數(shù)據(jù)恢復(fù)案例之服務(wù)器raid6中3個(gè)磁盤(pán)離線導(dǎo)致
    的頭像 發(fā)表于 03-04 13:21 ?868次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)raid5數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 華為OceanStor某型號(hào)存儲(chǔ),存儲(chǔ)內(nèi)有一組由24硬盤(pán)組建的raid5陣列
    的頭像 發(fā)表于 01-18 11:58 ?353次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor存儲(chǔ)<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)-EMC存儲(chǔ)raid5熱備盤(pán)未激活的數(shù)據(jù)恢復(fù)案例

    一臺(tái)emc某型號(hào)存儲(chǔ)服務(wù)器,存儲(chǔ)服務(wù)器上組建了一組raid5磁盤(pán)陣列,陣列中有兩塊磁盤(pán)作為熱備
    的頭像 發(fā)表于 12-19 14:02 ?325次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)-raid5故障導(dǎo)致上層卷無(wú)法掛載的數(shù)據(jù)恢復(fù)案例

    raid5陣列中有兩塊硬盤(pán)出現(xiàn)故障掉線,導(dǎo)致服務(wù)器上層卷無(wú)法掛載,oracle數(shù)據(jù)庫(kù)無(wú)法正
    的頭像 發(fā)表于 12-14 11:32 ?411次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5熱備盤(pán)未激活導(dǎo)致陣列崩潰數(shù)據(jù)恢復(fù)案例

    (oracle已經(jīng)不再為該OA系統(tǒng)提供后續(xù)服務(wù)支持)。 服務(wù)器故障: raid5中一磁盤(pán)離線,熱備
    的頭像 發(fā)表于 12-12 13:58 ?423次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b>熱備<b class='flag-5'>盤(pán)</b>未激活<b class='flag-5'>導(dǎo)致</b><b class='flag-5'>陣列</b><b class='flag-5'>崩潰</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例