raid5陣列常見故障:
1、服務(wù)器硬件故障或者RAID陣列卡故障;
2、服務(wù)器意外斷電導(dǎo)致的磁盤陣列故障;
3、服務(wù)器RAID陣列陣列磁盤出現(xiàn)物理故障,如:電路板壞、磁頭損壞、盤面劃傷、壞扇區(qū)、固件壞等;
4、誤操作導(dǎo)致磁盤盤序出現(xiàn)錯誤;
5、raid在同步數(shù)據(jù)或者重建過程中,同組raid陣列中又有其他硬盤掉線導(dǎo)致同步失敗。
RAID5磁盤陣列出現(xiàn)故障后需要注意的問題:
1、發(fā)現(xiàn)RAID5磁盤陣列發(fā)生故障或者數(shù)據(jù)丟失,建議不要盲目進(jìn)行rebuild操作。
Rebuild:通過陣列的校驗(yàn)功能,根據(jù)陣列內(nèi)其他正常硬盤中的數(shù)據(jù),計(jì)算&生成損壞硬盤中的數(shù)據(jù),然后同步到熱備盤中。Rebuild操作適用于raid5陣列中有1塊硬盤掉線的情況。針對raid5陣列中有2塊磁盤掉線的情況:如果第一塊硬盤掉線后服務(wù)器有寫入操作,第一塊掉線的硬盤數(shù)據(jù)在掉線后就不更新了。rebuild只能對先掉線的磁盤做Rebuild,如果對后掉線的磁盤做Rebuild操作,則部分陣列雖然能正常工作,但會出現(xiàn)數(shù)據(jù)錯亂,某些文件無法打開的情況。
2、RAID5陣列中硬盤掉線,建議不要盲目進(jìn)行強(qiáng)制上線操作。
從北亞企安數(shù)據(jù)恢復(fù)工程師做過的海量RAID5陣列數(shù)據(jù)恢復(fù)案例中來看,有部分raid5陣列數(shù)據(jù)丟失的原因是陣列中有一塊硬盤離線后沒有及時更換硬盤,此后服務(wù)器出現(xiàn)故障或者服務(wù)器重啟,原來離線的硬盤重新上線,而原本在線的硬盤反而故障離線,數(shù)據(jù)不能正常使用。
用戶對后離線的硬盤進(jìn)行強(qiáng)制上線操作,磁盤陣列自動同步,導(dǎo)致數(shù)據(jù)新舊混亂,服務(wù)器數(shù)據(jù)丟失。市面上多數(shù)品牌和型號的陣列卡在原先離線磁盤自動上線時會檢查校驗(yàn)信息,一旦發(fā)現(xiàn)校驗(yàn)信息不正確就會重新計(jì)算校驗(yàn)信息,無法在缺盤的情況下恢復(fù)數(shù)據(jù)。
3、千萬不要進(jìn)行初始化操作。
初始化類似于低級格式化,一旦對陣列進(jìn)行初始化操作,這個陣列內(nèi)所有硬盤的底層數(shù)據(jù)會被全部清零,導(dǎo)致陣列數(shù)據(jù)無法恢復(fù)。
4、重新配置陣列信息時要保持與原陣列配置信息一致。
一旦重新配置磁盤陣列的信息與原始磁盤陣列的信息不一致,陣列內(nèi)多數(shù)文件將無法打開,導(dǎo)致數(shù)據(jù)丟失。多數(shù)服務(wù)器都具有重新配置陣列信息后自動初始化的功能,這將導(dǎo)致數(shù)據(jù)無法恢復(fù)。
5、在進(jìn)行任何數(shù)據(jù)恢復(fù)操作前,務(wù)必將服務(wù)器內(nèi)的所有硬盤以只讀方式進(jìn)行扇區(qū)級的鏡像備份,避免破壞原始數(shù)據(jù)。
RAID5數(shù)據(jù)恢復(fù)方案:
1、將故障服務(wù)器中所有磁盤編號后取出,由硬件工程師對所有磁盤進(jìn)行硬件故障檢測。針對不存在硬件故障的磁盤,以只讀方式做鏡像;對于存在硬件故障的磁盤,由硬件工程師處理后使用專門的工具做鏡像備份。
2、基于鏡像文件分析底層數(shù)據(jù),根據(jù)分析底層數(shù)據(jù)獲取到的RAID5陣列結(jié)構(gòu)相關(guān)信息重組raid5陣列,然后導(dǎo)出數(shù)據(jù)。
3、驗(yàn)證導(dǎo)出的數(shù)據(jù),確認(rèn)數(shù)據(jù)無誤后重新搭建環(huán)境,將恢復(fù)出來的數(shù)據(jù)遷移到準(zhǔn)備好的服務(wù)器環(huán)境中。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8957瀏覽量
85080 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
538瀏覽量
17341 -
RAID5
+關(guān)注
關(guān)注
0文章
108瀏覽量
12700
發(fā)布評論請先 登錄
相關(guān)推薦
評論