服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
某品牌ProLiant DL系列服務(wù)器,
6塊SAS硬盤(pán)組成RAID5磁盤(pán)陣列,
WINDOWS SERVER操作系統(tǒng),
存儲(chǔ)了企業(yè)的內(nèi)部文件。
服務(wù)器故障&分析:
服務(wù)器在發(fā)生故障前有過(guò)幾次意外斷電,每次斷電重啟后沒(méi)有出現(xiàn)異常。直到最后一次斷電重啟沒(méi)有成功,RAID報(bào)錯(cuò),提示無(wú)法找到存儲(chǔ)設(shè)備。進(jìn)入RAID管理模塊,執(zhí)行任何操作就死機(jī)。管理員多次重啟服務(wù)器后還是無(wú)法成功進(jìn)入操作系統(tǒng)。
通常服務(wù)器出現(xiàn)這類故障,有很大的可能性是因?yàn)橐馔鈹嚯妼?dǎo)致RAID模塊損壞(RAID管理信息丟失或RAID模塊硬件損壞)。RAID陣列創(chuàng)建完成后,管理模塊信息就會(huì)固定下來(lái)不會(huì)再發(fā)生變化。但是raid陣列的模塊信息畢竟不是只讀的,也是可以修改的,而意外斷電就可能導(dǎo)致模塊信息被篡改或者丟失,多次斷電甚至可能導(dǎo)致RAID卡元器件損壞,服務(wù)器失去對(duì)多塊物理硬盤(pán)進(jìn)行RAID管理的中間層模塊。根據(jù)本案例服務(wù)器的故障表現(xiàn),北亞企安數(shù)據(jù)恢復(fù)工程師初步判斷故障原因就是RAID卡硬件損壞,如果是這種情況,通過(guò)常規(guī)方法無(wú)法獲取6塊磁盤(pán)中的數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、經(jīng)過(guò)物理故障檢測(cè)發(fā)現(xiàn)故障服務(wù)器內(nèi)的所有硬盤(pán)均可以正常讀取,無(wú)物理故障。
2、編號(hào)后將故障服務(wù)器內(nèi)的所有硬盤(pán)以只讀方式進(jìn)行鏡像備份,鏡像完成后將所有硬盤(pán)按照編號(hào)還原到故障服務(wù)器中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始數(shù)據(jù)造成二次破壞。
3、基于鏡像文件,北亞企安數(shù)據(jù)恢復(fù)工程師分析故障服務(wù)器中raid5磁盤(pán)陣列結(jié)構(gòu),確定raid陣列的硬盤(pán)順序、數(shù)據(jù)塊大小、陣列校驗(yàn)方式等raid相關(guān)信息。
4、利用獲取到的raid陣列信息虛擬重構(gòu)raid陣列并進(jìn)行邏輯校驗(yàn),確保重構(gòu)RAID各項(xiàng)參數(shù)正確無(wú)誤后驗(yàn)證重要數(shù)據(jù)。
5、經(jīng)過(guò)數(shù)據(jù)恢復(fù)工程師驗(yàn)證后沒(méi)有發(fā)現(xiàn)異常,讓管理員親自驗(yàn)證無(wú)問(wèn)題后將數(shù)據(jù)遷移到提前準(zhǔn)備好的環(huán)境中,本次數(shù)據(jù)恢復(fù)工作完成。
服務(wù)器數(shù)據(jù)安全Tips:
1、盡量保證機(jī)房供電穩(wěn)定,重要設(shè)備配備UPS,以減少供電異常影響服務(wù)器及存儲(chǔ)的正常工作。
2、應(yīng)定期對(duì)老舊設(shè)備進(jìn)行安全檢查,評(píng)估老舊設(shè)備的運(yùn)行狀態(tài),評(píng)估是否需要對(duì)老舊設(shè)備進(jìn)行硬件升級(jí)或者系統(tǒng)升級(jí)。
3、提前制定突發(fā)事件應(yīng)急處理方案,以降低異常斷電帶來(lái)的損失。
審核編輯黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8729瀏覽量
84616 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
508瀏覽量
17233
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論