0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

EVA存儲(chǔ)多塊硬盤(pán)離線的數(shù)據(jù)恢復(fù)案例

Frombyte ? 來(lái)源:Frombyte ? 作者:Frombyte ? 2023-04-14 12:01 ? 次閱讀

服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:

HP-EVA存儲(chǔ)環(huán)境:EVA某型號(hào)控制器+EVA擴(kuò)展柜+FC硬盤(pán)。

服務(wù)器故障:

EVA存儲(chǔ)中兩塊磁盤(pán)掉線導(dǎo)致存儲(chǔ)中某些LUN丟失不可用。

服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:

1、首先對(duì)故障存儲(chǔ)中所有磁盤(pán)做物理故障檢測(cè),經(jīng)過(guò)檢測(cè)沒(méi)有發(fā)現(xiàn)有硬盤(pán)存在物理故障。使用壞道檢測(cè)工具檢測(cè)也沒(méi)有發(fā)現(xiàn)壞道,磁盤(pán)壞道檢測(cè)日志部分截圖:

pYYBAGQ4z7yAKx95AAHQwWZpo1s129.png

北亞企安數(shù)據(jù)恢復(fù)——EVA存儲(chǔ)數(shù)據(jù)恢復(fù)

2、將故障存儲(chǔ)中所有磁盤(pán)以只讀方式做完整鏡像備份,以防后續(xù)數(shù)據(jù)恢復(fù)過(guò)程中操作不當(dāng)對(duì)原始數(shù)據(jù)造成二次破壞。部分備份數(shù)據(jù)如下:

pYYBAGQ4z9eAcWTDAAEMV5itO04047.png

北亞企安數(shù)據(jù)恢復(fù)——EVA存儲(chǔ)數(shù)據(jù)恢復(fù)

3、由于所有磁盤(pán)沒(méi)有發(fā)現(xiàn)物理故障或者壞道,可以判斷硬盤(pán)掉線是因?yàn)榇疟P(pán)讀寫(xiě)不穩(wěn)定導(dǎo)致的。EVA控制器對(duì)磁盤(pán)的檢測(cè)策略非常嚴(yán)格,EVA控制器會(huì)認(rèn)為性能不穩(wěn)定的磁盤(pán)是壞盤(pán),將認(rèn)為是壞盤(pán)的磁盤(pán)踢出磁盤(pán)組。如果某個(gè)LUN的同一個(gè)條帶中掉線的磁盤(pán)到達(dá)極限,這個(gè)LUN將不可用,即如果EVA存儲(chǔ)中所有的LUN都包含這些掉線的盤(pán),所有LUN都會(huì)受影響,所以兩塊磁盤(pán)掉線也會(huì)導(dǎo)致整個(gè)存儲(chǔ)的LUN都不可用。目前的情況是現(xiàn)存8個(gè)LUN,損壞7個(gè)LUN,丟失6個(gè)LUN,需要恢復(fù)存儲(chǔ)中所有LUN的數(shù)據(jù)。

4、HP-EVA的LUN都是以RAID條目的形式來(lái)存儲(chǔ)數(shù)據(jù)的,EVA將每個(gè)磁盤(pán)的不同塊組成一個(gè)RAID條目,RAID條目的類型可以有很多種。需要分析出組成LUN的RAID條目類型和這個(gè)RAID條目是由哪些盤(pán)的哪些塊組成。這些信息都存放在LUN_MAP中,每個(gè)LUN都有一份LUN_MAP。EVA將LUN_MAP分別存放在不同的磁盤(pán)中,使用一個(gè)索引來(lái)指定其位置。因此去每個(gè)磁盤(pán)中找到這個(gè)指向LUN_MAP的索引就可以找到現(xiàn)存LUN的信息。

5、雖然磁盤(pán)中記錄了指向LUN_MAP的索引,但是它只記錄現(xiàn)存的LUN,丟失的LUN是不會(huì)被記錄索引的。由于EVA中刪除一個(gè)LUN只會(huì)清除這個(gè)LUN的索引,并不會(huì)清除這個(gè)LUN的LUN_MAP。所以只需要掃描所有磁盤(pán),找到所有符合LUN_MAP的數(shù)據(jù)塊,排除現(xiàn)有的LUN_MAP,剩下的LUN_MAP也不一定全是刪除的,也有一些可能是舊的。這種情況下是無(wú)法在LUN_MAP中篩選的,只能先將所有LUN_MAP的數(shù)據(jù)都恢復(fù)出來(lái),人工去核對(duì)哪些LUN是刪除的。

6、掉線磁盤(pán)中存放的是一些舊的數(shù)據(jù),在生成數(shù)據(jù)的時(shí)候需要將這些磁盤(pán)都排除掉,提取數(shù)據(jù)之前需要把這些掉線磁盤(pán)找到。由于LUN的RAID結(jié)構(gòu)大多都是RAID5,只需要將一個(gè)LUN的RAID條目通過(guò)RAID5的校驗(yàn)算法算出校驗(yàn)值,再和原有的校驗(yàn)值做比較就可以判斷這個(gè)條目中是否有掉線盤(pán)。將一個(gè)LUN的所有LUN_MAP都校驗(yàn)一遍就可以知道這個(gè)LUN中的哪些RAID條目中有掉線盤(pán),這些RAID條目中都存在的那個(gè)盤(pán)就一定是掉線盤(pán)。排除掉掉線盤(pán)并根據(jù)LUN_MAP恢復(fù)所有LUN的數(shù)據(jù)即可。

7、北亞企安數(shù)據(jù)恢復(fù)工程師編寫(xiě)掃描LUN_MAP的程序掃描全部LUN_MAP,結(jié)合人工分析獲取到最精確的LUN_MAP。編寫(xiě)檢測(cè)RAID條目的程序檢測(cè)所有LUN中掉線的磁盤(pán),結(jié)合人工分析排除掉掉線的磁盤(pán)。編寫(xiě)LUN數(shù)據(jù)恢復(fù)程序結(jié)合LUN_MAP恢復(fù)所有LUN數(shù)據(jù)。

8、人工核對(duì)恢復(fù)出來(lái)的每個(gè)LUN,確認(rèn)是否和用戶方工程師描述的一致。部分LUN如下:

pYYBAGQ4z96AaouiAAEI0gfaVlo547.png

北亞企安數(shù)據(jù)恢復(fù)——EVA存儲(chǔ)數(shù)據(jù)恢復(fù)

數(shù)據(jù)驗(yàn)證:

用戶方工程師對(duì)恢復(fù)出來(lái)的數(shù)據(jù)進(jìn)行檢驗(yàn),經(jīng)過(guò)反復(fù)驗(yàn)證后確認(rèn)數(shù)據(jù)完整可用,本次數(shù)據(jù)恢復(fù)工作完成。

EVA存儲(chǔ)數(shù)據(jù)安全Tip:

1、經(jīng)常巡視機(jī)房設(shè)備,發(fā)現(xiàn)報(bào)警信息及時(shí)處理。

2、操作存儲(chǔ)時(shí)要謹(jǐn)慎,避免誤操作導(dǎo)致數(shù)據(jù)丟失。

3、如果發(fā)現(xiàn)EVA控制器部分模塊不穩(wěn)定,應(yīng)及時(shí)更換。

4、由于EVA存儲(chǔ)故障多是由磁盤(pán)不穩(wěn)定導(dǎo)致的,EVA存儲(chǔ)內(nèi)的磁盤(pán)應(yīng)該是同一批次的磁盤(pán)。因此,沒(méi)有掉線的磁盤(pán)性能也快到極限,如有條件建議一起更換這批磁盤(pán)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 控制器
    +關(guān)注

    關(guān)注

    112

    文章

    15885

    瀏覽量

    175365
  • 硬盤(pán)
    +關(guān)注

    關(guān)注

    3

    文章

    1269

    瀏覽量

    56989
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8701

    瀏覽量

    84546
  • 數(shù)據(jù)恢復(fù)

    關(guān)注

    10

    文章

    507

    瀏覽量

    17202
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    服務(wù)器數(shù)據(jù)恢復(fù)存儲(chǔ)中RAID5陣列兩盤(pán)離線數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 某品牌P2000存儲(chǔ),存儲(chǔ)中有一組由8
    的頭像 發(fā)表于 07-11 15:57 ?178次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>存儲(chǔ)</b>中RAID5陣列兩<b class='flag-5'>塊</b>盤(pán)<b class='flag-5'>離線</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中raid5陣列硬盤(pán)離線數(shù)據(jù)恢復(fù)案例

    突然崩潰。管理員檢查發(fā)現(xiàn)存儲(chǔ)中的raid5陣列有兩硬盤(pán)離線,該陣列中的兩熱備盤(pán)只有一熱備盤(pán)
    的頭像 發(fā)表于 07-09 11:58 ?136次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—raid5熱備盤(pán)同步過(guò)程中硬盤(pán)離線數(shù)據(jù)恢復(fù)案例

    某品牌DS5300存儲(chǔ),包含一個(gè)存儲(chǔ)機(jī)頭和多個(gè)磁盤(pán)柜,組建了多組RAID5磁盤(pán)陣列。 某個(gè)磁盤(pán)柜中的一組RAID5陣列由15數(shù)據(jù)盤(pán)和1
    的頭像 發(fā)表于 06-20 11:13 ?162次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲(chǔ)中雙循環(huán)riad5陣列數(shù)據(jù)恢復(fù)案例

    ,并沒(méi)有將掉線的硬盤(pán)拔掉,所以存儲(chǔ)中有3掉線的磁盤(pán)。 服務(wù)器存儲(chǔ)故障: 硬盤(pán)出現(xiàn)故障離線
    的頭像 發(fā)表于 06-18 11:10 ?309次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列硬盤(pán)離線且熱備盤(pán)未激活的數(shù)據(jù)恢復(fù)案例

    raid5陣列中兩硬盤(pán)由于未知故障離線,服務(wù)器數(shù)據(jù)丟失。北亞企安數(shù)據(jù)恢復(fù)中心安排服務(wù)器
    的頭像 發(fā)表于 06-06 17:07 ?293次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—raid5陣列<b class='flag-5'>硬盤(pán)</b><b class='flag-5'>離線</b>且熱備盤(pán)未激活的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—EqualLogic存儲(chǔ)硬盤(pán)故障導(dǎo)致存儲(chǔ)崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)某品牌EqualLogic PS 6011型號(hào)存儲(chǔ),底層有一組由16SAS硬盤(pán)組建的RAID5陣列,上層
    的頭像 發(fā)表于 05-31 11:35 ?353次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—EqualLogic<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>硬盤(pán)</b>故障導(dǎo)致<b class='flag-5'>存儲(chǔ)</b>崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列中磁盤(pán)掉線導(dǎo)致EVA存儲(chǔ)不可用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 1臺(tái)某品牌EVA4400控制器+3臺(tái)EVA4400擴(kuò)展柜+28FC硬盤(pán)
    的頭像 發(fā)表于 05-24 11:34 ?408次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—raid5陣列中<b class='flag-5'>多</b><b class='flag-5'>塊</b>磁盤(pán)掉線導(dǎo)致<b class='flag-5'>EVA</b><b class='flag-5'>存儲(chǔ)</b>不可用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)存儲(chǔ)中raid5陣列磁盤(pán)離線導(dǎo)致lun不可用的數(shù)據(jù)恢復(fù)案例

    服務(wù)器存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: 某品牌MSA2000存儲(chǔ),該存儲(chǔ)中有一組由8SAS
    的頭像 發(fā)表于 04-29 11:29 ?400次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>存儲(chǔ)</b>中raid5陣列<b class='flag-5'>多</b><b class='flag-5'>塊</b>磁盤(pán)<b class='flag-5'>離線</b>導(dǎo)致lun不可用的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    EVA數(shù)據(jù)恢復(fù)EVA存儲(chǔ)中磁盤(pán)掉線導(dǎo)致LUN丟失的數(shù)據(jù)恢復(fù)案例

    EVA存儲(chǔ)數(shù)據(jù)恢復(fù)環(huán)境: EVA控制器+三個(gè)擴(kuò)展柜+數(shù)十FC
    的頭像 發(fā)表于 04-19 13:28 ?221次閱讀
    <b class='flag-5'>EVA</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>EVA</b><b class='flag-5'>存儲(chǔ)</b>中磁盤(pán)掉線導(dǎo)致LUN丟失的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)—光纖存儲(chǔ)中raid5出現(xiàn)故障的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境&故障情況: 某企業(yè)光纖存儲(chǔ)上有一組由16硬盤(pán)組建的raid5陣列。管理員發(fā)現(xiàn)該光纖
    的頭像 發(fā)表于 04-10 15:38 ?322次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—V7000存儲(chǔ)硬盤(pán)掉線導(dǎo)致存儲(chǔ)崩潰的數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 一臺(tái)V7000存儲(chǔ),該存儲(chǔ)上有一組由12硬盤(pán)組建的raid5磁盤(pán)陣列,
    的頭像 發(fā)表于 04-08 11:15 ?315次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—V7000<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>多</b><b class='flag-5'>塊</b><b class='flag-5'>硬盤(pán)</b>掉線導(dǎo)致<b class='flag-5'>存儲(chǔ)</b>崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    【服務(wù)器數(shù)據(jù)恢復(fù)】DELL EqualLogic存儲(chǔ)raid5磁盤(pán)離線數(shù)據(jù)恢復(fù)案例

    某公司IT部門(mén)一臺(tái)某品牌EqualLogic PS6100系列存儲(chǔ)在運(yùn)行過(guò)程中突然崩潰。 服務(wù)器管理員對(duì)故障服務(wù)器存儲(chǔ)進(jìn)行初步檢查,經(jīng)過(guò)檢測(cè)發(fā)現(xiàn)導(dǎo)致該服務(wù)器存儲(chǔ)無(wú)法正常工作的原因是該存儲(chǔ)
    的頭像 發(fā)表于 01-24 14:32 ?274次閱讀
    【服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>】DELL EqualLogic<b class='flag-5'>存儲(chǔ)</b>raid5<b class='flag-5'>多</b><b class='flag-5'>塊</b>磁盤(pán)<b class='flag-5'>離線</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)EVA存儲(chǔ)數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 某品牌EVA某型號(hào)存儲(chǔ),底層是RAID5陣列,劃分了若干lun。 服務(wù)器故障&分析: 該存儲(chǔ)設(shè)備中raid5
    的頭像 發(fā)表于 01-23 13:53 ?331次閱讀

    服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲(chǔ)raid5數(shù)據(jù)恢復(fù)案例

    服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境: 華為OceanStor某型號(hào)存儲(chǔ),存儲(chǔ)內(nèi)有一組由24硬盤(pán)組建的raid
    的頭像 發(fā)表于 01-18 11:58 ?339次閱讀
    服務(wù)器<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—華為OceanStor<b class='flag-5'>存儲(chǔ)</b>raid5<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例

    服務(wù)器數(shù)據(jù)恢復(fù)-服務(wù)器硬盤(pán)掉線導(dǎo)致上層應(yīng)用崩潰的數(shù)據(jù)恢復(fù)案例

    某銀行的某一業(yè)務(wù)模塊崩潰,無(wú)法正常使用。排查服務(wù)器故障,發(fā)現(xiàn)運(yùn)行該業(yè)務(wù)模塊的服務(wù)器中硬盤(pán)離線,導(dǎo)致上層應(yīng)用崩潰。
    的頭像 發(fā)表于 10-20 16:40 ?370次閱讀