服務器故障&檢測:
某公司一臺IBM某型號服務器共16塊硬盤,管理員某天巡檢的時候發(fā)現該服務器的10號和13號硬盤燈顯示黃色,服務器宕機,服務器上跑的業(yè)務終止。
通過IBM storage manager查詢服務器狀態(tài),邏輯卷狀態(tài)報告“失敗”;6號盤的物理硬盤狀態(tài)報告“警告”,10號和13號盤報告“失敗”。通過IBM storage manager將當前服務器的日志進行完整備份,在備份的同時分析日志內容,獲得部分邏輯卷信息用于后期數據恢復使用。
服務器數據恢復過程:
1、將故障服務器內所有硬盤編號并取出。對所有硬盤進行物理故障檢測,16塊盤均能正常識別。檢測16塊盤的SMART狀態(tài),結果發(fā)現6號盤的SMART狀態(tài)為“警告”,和IBM storage manager中的報告一致。
2、將故障服務器中所有磁盤以只讀方式進行扇區(qū)級別的鏡像備份。在鏡像過程中6號磁盤的鏡像速度異常緩慢,結合6號盤SMART狀態(tài)可以判斷6號盤應該存在大量損壞的不穩(wěn)定扇區(qū),無法通過常規(guī)方式進行鏡像。
3、使用專業(yè)設備對6號盤進行鏡像,在鏡像過程中發(fā)現6號盤的壞道并不多,只是存在大量不穩(wěn)定扇區(qū)。調整鏡像策略,修改“遇到壞道跳過扇區(qū)數”、“響應等待時間”等參數后繼續(xù)對6號盤鏡像。
4、所有磁盤鏡像完成后查看日志,發(fā)現在IBM storage manager和硬盤SMART狀態(tài)中均沒有發(fā)現異常的1號盤也存在壞道,10號和13號盤也存在大量不規(guī)律的壞道分布。根據壞道列表定位到目標鏡像文件,經過分析發(fā)現ext3文件系統(tǒng)的一些關鍵源數據信息被破壞。只能等所有硬盤鏡像完成后,通過同一條帶進行xor
以及根據文件系統(tǒng)上下文關系手動修復被損壞的文件系統(tǒng)。
5、雖然6號盤鏡像完成,但是先前所做的鏡像策略會自動跳過一些不穩(wěn)定扇區(qū),所以6號盤的鏡像是不完整的。重新調整拷貝策略繼續(xù)鏡像被跳過的扇區(qū),完成6號盤所有扇區(qū)鏡像。
6、完成所有硬盤的鏡像后,北亞企安數據恢復工程師對ext3文件系統(tǒng)進行逆向分析,結合對日志文件的分析,最終獲取到16塊盤的盤序,RAID塊大小,RAID的校驗走向和方式等RAID相關信息。
7、利用獲取到的RAID相關信息虛擬重組RAID,重組完成后解析ext3文件系統(tǒng),通過和用戶溝通后提取出oracle的dmp文件并嘗試進行恢復。在使用dmp文件進行恢復的過程中,oracle報告imp-0008錯誤。北亞企安的oracle工程師分析dmp文件的日志文件后發(fā)現提取出的dmp文件有問題。
8、重新分析raid結構,進一步確定ext3文件系統(tǒng)被破壞的程度。經過數據恢復工程師團隊的不懈努力,終于重新提取出dmp文件和dbf原始庫文件。將提取出來的dmp文件移交給用戶,導入數據進行測試沒有發(fā)現問題。對恢復出來的dbf原始庫文件進行校驗,所有文件均通過測試。本次數據恢復工作完成。
審核編輯黃宇
-
服務器
+關注
關注
12文章
8958瀏覽量
85085 -
數據恢復
+關注
關注
10文章
538瀏覽量
17344
發(fā)布評論請先 登錄
相關推薦
評論