服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
某品牌ProLiant DL380系列服務(wù)器,服務(wù)器中有一組由6塊SAS硬盤組建的RAID5陣列,WINDOWS SERVER操作系統(tǒng),作為企業(yè)內(nèi)部文件服務(wù)器使用。
服務(wù)器故障:
機(jī)房供電幾次意外中斷,服務(wù)器出現(xiàn)故障前最后一次異常斷電重啟后RAID報錯,提示無法找到存儲設(shè)備,進(jìn)入RAID管理模塊做任何操作都死機(jī),重啟服務(wù)器后問題依舊,用戶聯(lián)系北亞企安數(shù)據(jù)恢復(fù)中心尋求幫助。
服務(wù)器意外斷電導(dǎo)致RAID故障(包括RAID管理信息丟失和RAID硬件損壞)的情況并不少見。RAID創(chuàng)建完成后,RAID管理模塊信息一般不會再發(fā)生改變,但RAID管理模塊信息是可修改的信息,磁盤陣列意外斷電也經(jīng)常會導(dǎo)致RAID管理信息被篡改或者丟失。多次斷電甚至有可能導(dǎo)致RAID卡元器件損壞,從而導(dǎo)致服務(wù)器失去對多塊物理硬盤進(jìn)行RAID管理的中間層模塊。本案例中的故障表現(xiàn)如在RAID模塊的任何操作都導(dǎo)致死機(jī)的現(xiàn)象就極有可能是RAID卡硬件損壞引起的(后經(jīng)服務(wù)器廠家售后人員驗證確實如此),如果是這種情況,通過常規(guī)方法已無法獲取RAID5陣列中6塊硬盤的數(shù)據(jù),只能通過專業(yè)的數(shù)據(jù)恢復(fù)技術(shù)手段來恢復(fù)服務(wù)器的數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器中所有磁盤編號后取出,由硬件工程師對6塊SAS硬盤進(jìn)行物理故障檢測,檢測結(jié)果是這6塊硬盤讀取狀態(tài)良好,無明顯的物理故障。
2、以只讀方式將所有磁盤進(jìn)行扇區(qū)級全盤鏡像,鏡像完成后按照編號將所有磁盤還原到故障服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
3、基于鏡像文件對原RAID5陣列的結(jié)構(gòu)進(jìn)行分析,獲取盤序、數(shù)據(jù)塊大小、校驗方式等重組raid5陣列所需要的信息,根據(jù)獲取到的信息重組RAID5陣列。
4、重組完成后對所RAID5陣列中的數(shù)據(jù)進(jìn)行邏輯校驗,在確保重組RAID所使用的參數(shù)正確無誤后,針對用戶所需要恢復(fù)的重要數(shù)據(jù)進(jìn)行驗證。
5、經(jīng)過驗證,用戶確認(rèn)恢復(fù)出來的數(shù)據(jù)完整有效,認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。協(xié)助用戶方將所有數(shù)據(jù)遷移至用戶準(zhǔn)備好的生產(chǎn)環(huán)境中。本次數(shù)據(jù)恢復(fù)工作完成。
服務(wù)器數(shù)據(jù)安全Tips:
1、盡最大可能保證機(jī)房供電穩(wěn)定,減少供電異常對服務(wù)器及存儲造成的破壞。
2、為重要的服務(wù)器及存儲配備UPS,在意外斷電的情況下能保證核心業(yè)務(wù)能繼續(xù)維持一段時間的運行,為應(yīng)急方案實施贏得時間。
3、定期對服務(wù)時間長的服務(wù)器進(jìn)行安全狀況檢查,并對整體運行狀態(tài)進(jìn)行評估以決定是否進(jìn)行硬件及系統(tǒng)的升級。
4、提前制定突發(fā)數(shù)據(jù)災(zāi)難的應(yīng)急處理方案,降低數(shù)據(jù)災(zāi)難造成的損失。
審核編輯 黃宇
-
硬盤
+關(guān)注
關(guān)注
3文章
1317瀏覽量
57490 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9303瀏覽量
86059 -
RAID
+關(guān)注
關(guān)注
0文章
279瀏覽量
35169 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
585瀏覽量
17630
發(fā)布評論請先 登錄
相關(guān)推薦
評論