0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

raid5陣列2塊硬盤先后離線的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來源:Frombyte ? 作者:Frombyte ? 2023-02-22 14:12 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:

華為s系列服務(wù)器;

24塊硬盤組成一組raid5磁盤陣列,其中包含1塊熱備盤。

服務(wù)器故障&檢測

服務(wù)器工作狀態(tài)下raid5中有一塊硬盤離線,熱備盤激活替換離線硬盤并開始進行數(shù)據(jù)同步,在同步的過程中該raid5陣列內(nèi)的另一塊硬盤由于未知原因離線,上層應(yīng)用崩潰,服務(wù)器內(nèi)的數(shù)據(jù)丟失。

拿到故障服務(wù)器內(nèi)的所有硬盤后,硬件工程師對所有硬盤進行物理故障檢測,發(fā)現(xiàn)除了其中的一塊硬盤外,其他硬盤均可以正常讀取無物理故障。

服務(wù)器數(shù)據(jù)恢復(fù)過程:

1、將故障服務(wù)器內(nèi)所有硬盤以只讀方式做完整的鏡像備份,后續(xù)數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進行,避免對原始數(shù)據(jù)造成二次破壞。

2、由于華為s系列服務(wù)器的控制器的磁盤檢測策略非常嚴格。對于沒有物理故障但性能不穩(wěn)定的硬盤,控制器會將其視作壞盤踢出陣列。之前檢測到只有一塊硬盤存在物理故障,因此故障服務(wù)器中掉線的兩塊盤中另外一塊是因為讀寫不穩(wěn)定被視作壞盤踢出而掉線。

3、對每一塊硬盤底層進行分析,獲取到raid陣列的條帶大小、數(shù)據(jù)走向、硬盤順序、熱備盤、數(shù)據(jù)庫的分布規(guī)律等raid相關(guān)信息。根據(jù)分析獲取到的raid陣列信息重組raid。

4、根據(jù)分析獲取到的陣列相關(guān)信息,使用北亞企安自主研發(fā)的工具重組原始raid5陣列。

5、在重組過程中發(fā)現(xiàn)有一塊硬盤內(nèi)的數(shù)據(jù)在同步時候被破壞。由于在數(shù)據(jù)恢復(fù)過程中需要將數(shù)據(jù)被損壞的硬盤排除,于是數(shù)據(jù)恢復(fù)工程師對所有硬盤進行了底層數(shù)據(jù)結(jié)構(gòu)的對比。對比發(fā)現(xiàn)其中一塊硬盤在相同條帶上的數(shù)據(jù)與其他硬盤明顯不同。

6、使用北亞自主研發(fā)的raid校驗程序?qū)υ撚脖P進行條帶校驗,確認該硬盤數(shù)據(jù)已經(jīng)在同步的時候被破壞。排除這塊硬盤后重組raid5磁盤陣列。

7、完成raid陣列重組后,分析lun在raid中的分配情況及數(shù)據(jù)塊map。只要能將map完整提取出來,就可以進行解析并提取lun數(shù)據(jù)。

8、北亞企安數(shù)據(jù)恢復(fù)工程師編寫文件系統(tǒng)解析程序?qū)﹃嚵袃?nèi)文件系統(tǒng)進行解析并導(dǎo)出數(shù)據(jù)庫文件。

9、由數(shù)據(jù)庫工程師對提取的數(shù)據(jù)庫文件進行校驗和修復(fù)。數(shù)據(jù)庫工程師對數(shù)據(jù)庫文件進行驗證后發(fā)現(xiàn)部分數(shù)據(jù)庫文件及日志文件異常,表空間內(nèi)存在大量壞塊、所有控制文件被破壞,undotbs02丟失,數(shù)據(jù)庫工程師對數(shù)據(jù)庫文件進行了修復(fù)。

修復(fù)過程:

pYYBAGP1sg2AM0nPAAJ8HYeS4xo980.png

北亞企安數(shù)據(jù)恢復(fù)——oracle數(shù)據(jù)庫數(shù)據(jù)恢復(fù)

pYYBAGP1shaAc36SAAMhSvbcnYQ303.png

北亞企安數(shù)據(jù)恢復(fù)——oracle數(shù)據(jù)庫數(shù)據(jù)恢復(fù)

數(shù)據(jù)驗證:

經(jīng)過數(shù)據(jù)庫工程師對數(shù)據(jù)庫文件的修復(fù)和驗證,最終恢復(fù)出所有的數(shù)據(jù)庫文件。服務(wù)器數(shù)據(jù)恢復(fù)工程師將修復(fù)成功的數(shù)據(jù)庫數(shù)據(jù)導(dǎo)入到準備好的環(huán)境中進行驗證,所有數(shù)據(jù)正常。聯(lián)系用戶親自對數(shù)據(jù)進行驗證均無異常。本次數(shù)據(jù)恢復(fù)工作完成。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8947

    瀏覽量

    85065
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    537

    瀏覽量

    17339
  • RAID5
    +關(guān)注

    關(guān)注

    0

    文章

    108

    瀏覽量

    12698
收藏 人收藏

    評論

    相關(guān)推薦

    服務(wù)器數(shù)據(jù)恢復(fù)—用5RAID5陣列中的4盤重建RAID5陣列后如何恢復(fù)原始數(shù)據(jù)

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺服務(wù)器掛接一臺存儲,該存儲中有一組由5硬盤組建的RAID5
    的頭像 發(fā)表于 10-30 15:07 ?103次閱讀

    RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列

    RAID5數(shù)據(jù)恢復(fù)環(huán)境: 一臺存儲上有一組由12SCSI硬盤(11
    的頭像 發(fā)表于 10-22 15:48 ?130次閱讀
    <b class='flag-5'>RAID5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—如何重組<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>?

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復(fù)案例

    。 服務(wù)器故障: 這組raid5陣列中一磁盤離線,但是熱備盤并沒有自動激活rebuild,當(dāng)另外一
    的頭像 發(fā)表于 10-15 10:33 ?146次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b><b class='flag-5'>硬盤</b><b class='flag-5'>離線</b>但熱備盤未激活的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)Raid5陣列硬盤指示燈亮黃色的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺某品牌存儲設(shè)備上有一組由10硬盤(9數(shù)據(jù)盤+1
    的頭像 發(fā)表于 10-10 13:48 ?115次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>Raid5</b><b class='flag-5'>陣列</b>兩<b class='flag-5'>塊</b><b class='flag-5'>硬盤</b>指示燈亮黃色的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器磁盤陣列數(shù)據(jù)恢復(fù)環(huán)境: 服務(wù)器中有兩組分別由4SAS硬盤組建的raid5磁盤
    的頭像 發(fā)表于 09-19 11:01 ?209次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>熱備盤上線同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 一臺EMC某型號存儲中有一組RAID5磁盤陣列。該raid5陣列中有
    的頭像 發(fā)表于 08-14 11:27 ?333次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>熱備盤未全部成功啟用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: 華為S5300存儲中有一組由16FC硬盤組建的RAID5磁盤陣列
    的頭像 發(fā)表于 07-15 11:38 ?467次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b>熱備盤同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲中raid5陣列硬盤離線數(shù)據(jù)恢復(fù)案例

    突然崩潰。管理員檢查發(fā)現(xiàn)存儲中的raid5陣列有兩硬盤離線,該陣列中的兩
    的頭像 發(fā)表于 07-09 11:58 ?185次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5熱備盤同步過程中硬盤離線數(shù)據(jù)恢復(fù)案例

    某品牌DS5300存儲,包含一個存儲機頭和多個磁盤柜,組建了多組RAID5磁盤陣列。 某個磁盤柜中的一組RAID5陣列由15
    的頭像 發(fā)表于 06-20 11:13 ?218次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤離線且熱備盤未激活的數(shù)據(jù)恢復(fù)案例

    raid5陣列中兩硬盤由于未知故障離線,服務(wù)器數(shù)據(jù)丟失。北亞企安
    的頭像 發(fā)表于 06-06 17:07 ?352次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>硬盤</b><b class='flag-5'>離線</b>且熱備盤未激活的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5陣列盤出現(xiàn)物理故障離線數(shù)據(jù)恢復(fù)案例

    服務(wù)器中有一組由多硬盤組建的raid5磁盤陣列,服務(wù)器陣列2
    的頭像 發(fā)表于 05-09 14:02 ?220次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>兩<b class='flag-5'>塊</b>盤出現(xiàn)物理故障<b class='flag-5'>離線</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—StorNext文件系統(tǒng)下raid5數(shù)據(jù)恢復(fù)案例

    ,劃分2個存儲系統(tǒng)。 服務(wù)器故障: 數(shù)據(jù)存儲的1個存儲系統(tǒng)中的一組RAID5陣列中有2
    的頭像 發(fā)表于 04-22 14:51 ?358次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—StorNext文件系統(tǒng)下<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲raid5數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 華為OceanStor某型號存儲,存儲內(nèi)有一組由24硬盤組建的raid5陣列
    的頭像 發(fā)表于 01-18 11:58 ?418次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor存儲<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    【服務(wù)器數(shù)據(jù)恢復(fù)Raid5硬盤離線導(dǎo)致熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 兩組由4磁盤組建的raid5磁盤陣列,兩組raid5
    的頭像 發(fā)表于 01-08 13:38 ?284次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲raid5故障的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲數(shù)據(jù)恢復(fù)環(huán)境: EMC某型號存儲,8組建一組raid5磁盤陣列。上層操作系統(tǒng)采用zfs文件系統(tǒng)。 服務(wù)器存儲故障&分析:
    的頭像 發(fā)表于 11-30 11:59 ?528次閱讀