0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

【服務(wù)器數(shù)據(jù)恢復(fù)】raid5掉線2塊硬盤(pán)后強(qiáng)制上線失敗的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來(lái)源:Frombyte ? 作者:Frombyte ? 2023-04-03 11:43 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
公司網(wǎng)站服務(wù)器,6塊SCSI硬盤(pán)組建raid5磁盤(pán)陣列;
服務(wù)器上層:linux操作系統(tǒng)+EXT3文件系統(tǒng)。

服務(wù)器故障&分析:
服務(wù)器在工作狀態(tài)下raid5磁盤(pán)陣列中的一塊硬盤(pán)由于未知原因離線。因?yàn)閞aid5中的一塊硬盤(pán)掉線并不會(huì)影響磁盤(pán)陣列的正常工作,服務(wù)器沒(méi)有出現(xiàn)異常,直到該raid5磁盤(pán)陣列中又有一塊硬盤(pán)掉線,服務(wù)器癱瘓。
管理員發(fā)現(xiàn)服務(wù)故障后,對(duì)raid5磁盤(pán)陣列進(jìn)行了檢查,但是不能確定這兩塊硬盤(pán)的離線順序,抱著碰運(yùn)氣的想法選擇了其中一塊離線硬盤(pán)嘗試強(qiáng)制上線操作。將這塊硬盤(pán)強(qiáng)制上線后發(fā)現(xiàn)操作系統(tǒng)啟動(dòng)時(shí)出現(xiàn)異常,為了避免再次對(duì)數(shù)據(jù)造成破壞,管理員將服務(wù)器關(guān)機(jī),之后沒(méi)有進(jìn)行任何操作。
在過(guò)去十多年中,北亞企安數(shù)據(jù)恢復(fù)工程師們經(jīng)常遇到類似的raid5故障:由于發(fā)現(xiàn)不及時(shí)或者第一塊硬盤(pán)掉線時(shí)不在意并沒(méi)有及時(shí)處理,當(dāng)?shù)诙K硬盤(pán)甚至更多的硬盤(pán)掉線時(shí),磁盤(pán)陣列徹底崩潰。第二塊磁盤(pán)掉線后對(duì)后離線的硬盤(pán)進(jìn)行強(qiáng)制上線具有一定的可操作性行,但是也有很大的風(fēng)險(xiǎn)。
強(qiáng)制上線最好由經(jīng)驗(yàn)豐富的管理員或者數(shù)據(jù)恢復(fù)工程師進(jìn)行操作,而且強(qiáng)制上線之前必須做好備份工作。這個(gè)案例就是管理員在沒(méi)有備份,也沒(méi)有搞清楚硬盤(pán)離線順序的情況下進(jìn)行了強(qiáng)制上線操作,最終導(dǎo)致數(shù)據(jù)丟失,服務(wù)器崩潰。

服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、將故障服務(wù)器內(nèi)的所有硬盤(pán)編號(hào)后取出,以只讀方式對(duì)所有硬盤(pán)進(jìn)行鏡像備份。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始數(shù)據(jù)造成二次破壞。
2、在鏡像過(guò)程中發(fā)現(xiàn)除了已經(jīng)掉線的兩塊硬盤(pán)外,其他沒(méi)有掉線硬盤(pán)存在壞道,由于這些硬盤(pán)沒(méi)有離線所以暫時(shí)沒(méi)有進(jìn)行特殊處理。
3、備份完成后基于鏡像文件分析原raid5磁盤(pán)陣列的組成結(jié)構(gòu)并虛擬重構(gòu)raid5環(huán)境。
4、由于管理員對(duì)磁盤(pán)陣列進(jìn)行過(guò)強(qiáng)制上線的操作,該操作破壞了部分?jǐn)?shù)據(jù)結(jié)構(gòu)。
5、驗(yàn)證raid5結(jié)構(gòu)后由北亞企安數(shù)據(jù)恢復(fù)工程師手工修復(fù)被破壞的那部分結(jié)構(gòu),導(dǎo)出磁盤(pán)陣列內(nèi)的所有數(shù)據(jù)。經(jīng)過(guò)數(shù)據(jù)恢復(fù)工程師和管理員的驗(yàn)證,確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)完整有效。
6、在數(shù)據(jù)恢復(fù)工程師的協(xié)助下,管理員在準(zhǔn)備好的服務(wù)器環(huán)境上重新搭建磁盤(pán)陣列并遷移數(shù)據(jù)。

服務(wù)器數(shù)據(jù)恢復(fù)Tip:
1、服務(wù)器發(fā)生故障后,切忌對(duì)服務(wù)器進(jìn)行操作;也不要隨意取出硬盤(pán),以免弄亂盤(pán)序。
2、如果需要取出硬盤(pán),標(biāo)記好硬盤(pán)的順序之后再取出。
3、服務(wù)器磁盤(pán)陣列癱瘓后應(yīng)該立即斷電,不要做同步或強(qiáng)制上線操作,防止數(shù)據(jù)進(jìn)一步破壞。
4、當(dāng)服務(wù)器由于未知原因的故障而導(dǎo)致系統(tǒng)崩潰或者文件不識(shí)別/不可用時(shí),通常不建議盲目地在服務(wù)器上進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作。如果確實(shí)對(duì)自己的數(shù)據(jù)恢復(fù)技術(shù)有自信,必須先對(duì)原服務(wù)器的所有硬盤(pán)數(shù)據(jù)進(jìn)行鏡像備份,數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作只能在鏡像文件上進(jìn)行,避免操作失誤破壞原始數(shù)據(jù),讓后續(xù)的數(shù)據(jù)恢復(fù)難度增加。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 硬盤(pán)
    +關(guān)注

    關(guān)注

    3

    文章

    1269

    瀏覽量

    56989
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8701

    瀏覽量

    84546
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    507

    瀏覽量

    17202
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤(pán)上線同步失敗數(shù)據(jù)恢復(fù)案例

    服務(wù)器磁盤(pán)陣列數(shù)據(jù)恢復(fù)環(huán)境: 服務(wù)器中有兩組分別由4SAS硬盤(pán)組建的
    的頭像 發(fā)表于 09-19 11:01 ?86次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b>陣列熱備盤(pán)<b class='flag-5'>上線</b>同步<b class='flag-5'>失敗</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—雙循環(huán)RAID5陣列崩潰,數(shù)據(jù)如何恢復(fù)

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)存儲(chǔ)中有一組由7硬盤(pán)組建的RAID5陣列,存儲(chǔ)中還有另外3
    的頭像 發(fā)表于 09-02 11:35 ?212次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—不當(dāng)操作導(dǎo)致raid5陣列數(shù)據(jù)無(wú)法恢復(fù)的案例

    : 運(yùn)行過(guò)程中該服務(wù)器raid5磁盤(pán)陣列癱瘓,管理員檢查服務(wù)器發(fā)現(xiàn)raid5陣列中已經(jīng)有3磁盤(pán)離線。管理員選擇其中
    的頭像 發(fā)表于 08-28 13:39 ?127次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)硬盤(pán)離線導(dǎo)致Raid5陣列熱備盤(pán)上線失敗數(shù)據(jù)恢復(fù)案例

    硬盤(pán)出現(xiàn)故障掉線,該組Raid崩潰,LVM結(jié)構(gòu)不完整,文件系統(tǒng)不可用,服務(wù)器癱瘓。 管理員檢查掉線的兩
    的頭像 發(fā)表于 08-09 13:52 ?99次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>硬盤(pán)</b>離線導(dǎo)致<b class='flag-5'>Raid5</b>陣列熱備盤(pán)<b class='flag-5'>上線</b><b class='flag-5'>失敗</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列熱備盤(pán)同步失敗數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 華為S5300存儲(chǔ)中有一組由16FC硬盤(pán)組建的RAID5磁盤(pán)陣列(
    的頭像 發(fā)表于 07-15 11:38 ?360次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b>陣列熱備盤(pán)同步<b class='flag-5'>失敗</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列磁盤(pán)離線強(qiáng)制上線導(dǎo)致數(shù)據(jù)丟失的數(shù)據(jù)恢復(fù)案例

    陣列發(fā)現(xiàn)raid5陣列中有兩硬盤(pán)離線,將其中一硬盤(pán)進(jìn)行
    的頭像 發(fā)表于 06-07 14:38 ?295次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)raid5陣列硬盤(pán)離線且熱備盤(pán)未激活的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 某品牌x3850 X5服務(wù)器,服務(wù)器上有一組由
    的頭像 發(fā)表于 06-06 17:07 ?293次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>raid5</b>陣列<b class='flag-5'>硬盤(pán)</b>離線且熱備盤(pán)未激活的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—X3650服務(wù)器raid5磁盤(pán)陣列數(shù)據(jù)恢復(fù)案例

    內(nèi)的數(shù)據(jù)丟失。 數(shù)據(jù)恢復(fù)工程師在現(xiàn)場(chǎng)對(duì)故障服務(wù)器raid5陣列中的磁盤(pán)進(jìn)行硬件故障檢測(cè),經(jīng)過(guò)檢測(cè)發(fā)現(xiàn)該
    的頭像 發(fā)表于 06-04 11:08 ?349次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)RAID5磁盤(pán)掉線導(dǎo)致崩潰的數(shù)據(jù)恢復(fù)案例

    某公司的一臺(tái)服務(wù)器中的raid5磁盤(pán)陣列有兩磁盤(pán)先后掉線,服務(wù)器崩潰。故障服務(wù)器的操作系統(tǒng)為l
    的頭像 發(fā)表于 05-21 11:43 ?510次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>RAID5</b>多<b class='flag-5'>塊</b>磁盤(pán)<b class='flag-5'>掉線</b>導(dǎo)致崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—V7000存儲(chǔ)多硬盤(pán)掉線導(dǎo)致存儲(chǔ)崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)V7000存儲(chǔ),該存儲(chǔ)上有一組由12硬盤(pán)組建的raid5磁盤(pán)陣列,
    的頭像 發(fā)表于 04-08 11:15 ?315次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—V7000存儲(chǔ)多<b class='flag-5'>塊</b><b class='flag-5'>硬盤(pán)</b><b class='flag-5'>掉線</b>導(dǎo)致存儲(chǔ)崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)raid5數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 華為OceanStor某型號(hào)存儲(chǔ),存儲(chǔ)內(nèi)有一組由24硬盤(pán)組建的raid5
    的頭像 發(fā)表于 01-18 11:58 ?339次閱讀
    <b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor存儲(chǔ)<b class='flag-5'>raid5</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)Raid5硬盤(pán)離線導(dǎo)致熱備盤(pán)上線同步失敗數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 兩組由4磁盤(pán)組建的raid5磁盤(pán)陣列,兩組raid5陣列劃分為lun并
    的頭像 發(fā)表于 01-08 13:38 ?240次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)服務(wù)器raid5離線硬盤(pán)上線失敗數(shù)據(jù)恢復(fù)案例

    正常工作。北亞企安數(shù)據(jù)恢復(fù)工程師去現(xiàn)場(chǎng)對(duì)故障服務(wù)器進(jìn)行了檢測(cè),發(fā)現(xiàn)故障服務(wù)器raid5陣列中有一
    的頭像 發(fā)表于 01-05 13:46 ?376次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)-raid5故障導(dǎo)致上層卷無(wú)法掛載的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)服務(wù)器中有一組由24FC硬盤(pán)組建的
    的頭像 發(fā)表于 12-14 11:32 ?406次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)raid5故障的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: EMC某型號(hào)存儲(chǔ),8組建一組raid5磁盤(pán)陣列。上層操作系統(tǒng)采用zfs文件系統(tǒng)。
    的頭像 發(fā)表于 11-30 11:59 ?477次閱讀