0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來源:Frombyte ? 作者:Frombyte ? 2024-10-15 10:33 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)服務(wù)器上有一組由5塊硬盤(4塊數(shù)據(jù)盤+1塊熱備盤)組建的raid5陣列。服務(wù)器安裝Linux Redhat操作系統(tǒng),運(yùn)行一套基于oracle數(shù)據(jù)庫(kù)的OA系統(tǒng)。

服務(wù)器故障:
這組raid5陣列中一塊磁盤離線,但是熱備盤并沒有自動(dòng)激活rebuild,當(dāng)另外一塊數(shù)據(jù)盤發(fā)生故障離線后,raid崩潰。
用戶方要求恢復(fù)raid數(shù)據(jù),同時(shí)要求還原操作系統(tǒng)。經(jīng)過初步觀察,raid中的這些硬盤沒有表現(xiàn)出存在明顯的物理故障的特征,也沒有明顯的同步表現(xiàn),數(shù)據(jù)恢復(fù)的可能性很大。

服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、關(guān)閉服務(wù)器,將所有磁盤標(biāo)記后取出并掛到一個(gè)只讀環(huán)境上進(jìn)行完整磁盤鏡像。鏡像完成后將所有磁盤按照原樣還原到原服務(wù)器中,后后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
2、鏡像過程中在后掉線的硬盤中發(fā)現(xiàn)了幾十個(gè)壞扇區(qū),其他硬盤都沒有發(fā)現(xiàn)問題?;阽R像文件分析所有磁盤底層數(shù)據(jù),或者重組raid所需要的信息(盤序、塊大小、數(shù)據(jù)校驗(yàn)方式、條帶方向等)。

wKgaomS-P5qABpvpAAJHt7YF-2Q139.png北亞企安數(shù)據(jù)恢復(fù)—RAID5數(shù)據(jù)恢復(fù)



3、嘗試重組raid。重組完成后驗(yàn)證數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)量在200M以上壓縮包解壓正常,說明raid結(jié)構(gòu)是正確的。按照這個(gè)結(jié)構(gòu)在一塊單盤上生成raid并嘗試打開,沒有報(bào)錯(cuò)。
4、將生成raid的這塊單盤接入到原服務(wù)器。用linux SystemRescueCd啟動(dòng),然后通過dd命令進(jìn)行全盤回寫。啟動(dòng)操作系統(tǒng)出現(xiàn)報(bào)錯(cuò):/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied,
初步判斷這個(gè)文件權(quán)限出了問題。使用SystemRescueCd重啟檢查后發(fā)現(xiàn)該文件的權(quán)限、大小、時(shí)間都存在明顯的錯(cuò)誤,節(jié)點(diǎn)損壞。
5、重新分析重組數(shù)據(jù)中的根分區(qū),定位出錯(cuò)的/sbin/pidof,發(fā)現(xiàn)導(dǎo)致問題出現(xiàn)的原因就是那塊后掉線磁盤上的壞道。使用另外幾塊完好的數(shù)據(jù)盤對(duì)后掉線的那塊盤的損壞區(qū)域進(jìn)行xor補(bǔ)齊,可是補(bǔ)齊之后校驗(yàn)文件系統(tǒng)依然報(bào)錯(cuò)。再一次檢查iNode表發(fā)現(xiàn)后掉線的那塊盤的損壞區(qū)域有部分節(jié)點(diǎn)表現(xiàn)為55 55 55部分。

wKgZomS-P7OAZ4aPAAN7tH44zek109.png北亞企安數(shù)據(jù)恢復(fù)—RAID5數(shù)據(jù)恢復(fù)



6、節(jié)點(diǎn)中描述的uid雖然看起來正常,但是大小、屬性、最初分配塊都是錯(cuò)誤的。分析了所有的可能性方案,發(fā)現(xiàn)都無法將這個(gè)損壞節(jié)點(diǎn)找回來,只能嘗試修復(fù)或者以相同文件代替。
7、通過日志將所有可能有錯(cuò)的文件原節(jié)點(diǎn)塊的節(jié)點(diǎn)信息確定出來,然后進(jìn)行修正。修正之后重新dd根分區(qū),然后執(zhí)行fsck -fn /dev/sda5,仍然報(bào)錯(cuò)。

wKgaomS-P7yAfX7bAANiPQsMCzk732.png北亞企安數(shù)據(jù)恢復(fù)—RAID5數(shù)據(jù)恢復(fù)



8、根據(jù)報(bào)錯(cuò)提示重新分析,發(fā)現(xiàn)系統(tǒng)中有多個(gè)節(jié)點(diǎn)共用同樣的數(shù)據(jù)塊,原來是第一塊離線硬盤的掉線時(shí)間比較早,導(dǎo)致出現(xiàn)節(jié)點(diǎn)信息新舊交集的情況。將錯(cuò)誤節(jié)點(diǎn)清除后再次執(zhí)行fsck -fn /dev/sda5,依然報(bào)錯(cuò)。
好在這些節(jié)點(diǎn)大多是在doc目錄下,不影響系統(tǒng)啟動(dòng)。于是強(qiáng)行修復(fù)&重啟系統(tǒng),進(jìn)入桌面啟動(dòng)數(shù)據(jù)庫(kù)和應(yīng)用軟件,無報(bào)錯(cuò)。
9、用戶方仔細(xì)檢測(cè)后,確認(rèn)重要數(shù)據(jù)都在,認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8947

    瀏覽量

    85065
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    537

    瀏覽量

    17339
  • RAID5
    +關(guān)注

    關(guān)注

    0

    文章

    108

    瀏覽量

    12698
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    RAID5數(shù)據(jù)恢復(fù)—如何重組RAID5陣列

    RAID5數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)存儲(chǔ)上有一組由12塊SCSI硬盤(11塊數(shù)據(jù)+1塊
    的頭像 發(fā)表于 10-22 15:48 ?130次閱讀
    <b class='flag-5'>RAID5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—如何重組<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b>?

    服務(wù)器數(shù)據(jù)恢復(fù)Raid5陣列兩塊硬盤指示燈亮黃色的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)某品牌存儲(chǔ)設(shè)備上有一組由10塊硬盤(9塊數(shù)據(jù)+1塊
    的頭像 發(fā)表于 10-10 13:48 ?115次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>Raid5</b><b class='flag-5'>陣列</b>兩塊<b class='flag-5'>硬盤</b>指示燈亮黃色的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器磁盤陣列數(shù)據(jù)恢復(fù)環(huán)境: 服務(wù)器中有兩組分別由4塊SAS硬盤組建的
    的頭像 發(fā)表于 09-19 11:01 ?209次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b>盤上線同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列未全部成功啟用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)EMC某型號(hào)存儲(chǔ)中有一組RAID5磁盤陣列。該raid5
    的頭像 發(fā)表于 08-14 11:27 ?333次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>未全部成功啟用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)硬盤離線導(dǎo)致Raid5陣列盤上線失敗的數(shù)據(jù)恢復(fù)案例

    兩組分別由4塊SAS硬盤組建的raid5磁盤陣列,ext3文件系統(tǒng)+lvm結(jié)構(gòu)。 磁盤陣列中一塊硬盤
    的頭像 發(fā)表于 08-09 13:52 ?149次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>硬盤</b><b class='flag-5'>離線</b>導(dǎo)致<b class='flag-5'>Raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b>盤上線失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 華為S5300存儲(chǔ)中有一組由16塊FC硬盤組建的RAID5磁盤陣列
    的頭像 發(fā)表于 07-15 11:38 ?467次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b>同步失敗的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列未完全激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 北京某企業(yè)一臺(tái)EMC FCAX-4存儲(chǔ)上搭建一組由12塊成員raid5磁盤
    的頭像 發(fā)表于 07-12 10:58 ?277次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中raid5陣列多塊硬盤離線數(shù)據(jù)恢復(fù)案例

    突然崩潰。管理員檢查發(fā)現(xiàn)存儲(chǔ)中的raid5陣列有兩塊硬盤離線,該陣列中的兩塊
    的頭像 發(fā)表于 07-09 11:58 ?185次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5同步過程中硬盤離線數(shù)據(jù)恢復(fù)案例

    某品牌DS5300存儲(chǔ),包含一個(gè)存儲(chǔ)機(jī)頭和多個(gè)磁盤柜,組建了多組RAID5磁盤陣列。 某個(gè)磁盤柜中的一組RAID5陣列由15塊數(shù)據(jù)
    的頭像 發(fā)表于 06-20 11:13 ?218次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤離線未激活數(shù)據(jù)恢復(fù)案例

    raid5陣列中兩塊硬盤由于未知故障離線,服務(wù)器數(shù)據(jù)丟失。北亞企安
    的頭像 發(fā)表于 06-06 17:07 ?352次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>陣列</b><b class='flag-5'>硬盤</b><b class='flag-5'>離線</b>且<b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b><b class='flag-5'>未激活</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5陣列硬盤報(bào)警亮黃燈的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 某品牌P2000服務(wù)器,有一組由數(shù)塊硬盤組建的raid5磁盤
    的頭像 發(fā)表于 05-30 11:43 ?981次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b><b class='flag-5'>陣列</b><b class='flag-5'>硬盤</b>報(bào)警亮黃燈的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)raid5數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 華為OceanStor某型號(hào)存儲(chǔ),存儲(chǔ)內(nèi)有一組由24塊硬盤組建的raid5陣列
    的頭像 發(fā)表于 01-18 11:58 ?418次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor存儲(chǔ)<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)Raid5硬盤離線導(dǎo)致盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 兩組由4塊磁盤組建的raid5磁盤陣列,兩組raid5
    的頭像 發(fā)表于 01-08 13:38 ?284次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)-EMC存儲(chǔ)raid5未激活數(shù)據(jù)恢復(fù)案例

    一臺(tái)emc某型號(hào)存儲(chǔ)服務(wù)器,存儲(chǔ)服務(wù)器上組建了一組raid5磁盤陣列,陣列中有兩塊磁盤作為
    的頭像 發(fā)表于 12-19 14:02 ?361次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5未激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例

    (oracle已經(jīng)不再為該OA系統(tǒng)提供后續(xù)服務(wù)支持)。 服務(wù)器故障: raid5中一塊磁盤離線,
    的頭像 發(fā)表于 12-12 13:58 ?466次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b><b class='flag-5'>熱</b><b class='flag-5'>備</b><b class='flag-5'>盤</b><b class='flag-5'>未激活</b>導(dǎo)致<b class='flag-5'>陣列</b>崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例