服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺采用zfs文件系統(tǒng)的服務(wù)器,配備32塊硬盤。
服務(wù)器故障:
服務(wù)器在運(yùn)行過程中崩潰,經(jīng)過初步檢測沒有發(fā)現(xiàn)服務(wù)器有物理故障,重啟服務(wù)器后故障依舊,用戶聯(lián)系我們中心要求恢復(fù)服務(wù)器數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、服務(wù)器數(shù)據(jù)恢復(fù)工程師對故障服務(wù)器中所有硬盤進(jìn)行了扇區(qū)級鏡像備份,后續(xù)的數(shù)據(jù)恢復(fù)操作都在鏡像文件上進(jìn)行,避免了可能對原始數(shù)據(jù)造成的二次破壞。
2、通過對鏡像文件的分析,服務(wù)器數(shù)據(jù)恢復(fù)工程師獲取關(guān)于故障服務(wù)器一些信息:服務(wù)器操作系統(tǒng)采用的zfs文件系統(tǒng),總共組建了4組raidz。4組raidz中的2組raidz的熱備盤已經(jīng)啟用,其中第一組啟用了1塊熱備盤,第二組啟用了3塊熱備盤。第一組啟動了一塊熱備盤后又有一塊正常硬盤掉線,第二組中有2塊硬盤掉線。
兩組raidz均在有硬盤離線的情況下啟用了熱備盤進(jìn)行了壞盤的替換,熱備盤上線后第這兩組raidz又有其他的硬盤離線。zpool在每次讀取數(shù)據(jù)時(shí)候都需要進(jìn)行校驗(yàn)獲取到正確數(shù)據(jù),緊接著第二組raidz又有硬盤離線,服務(wù)器因此崩潰。
3、重組ZPOOL,追蹤數(shù)據(jù)入口。zfs文件系統(tǒng)管理的存儲池與常規(guī)存儲不同,所有磁盤都由ZFS進(jìn)行管理。常規(guī)RAID在存儲數(shù)據(jù)時(shí),只按照特定的規(guī)則組建池,不關(guān)心文件在子設(shè)備上的位置。而ZFS在數(shù)據(jù)存儲時(shí)會為每次寫入的數(shù)據(jù)分配適當(dāng)大小的空間,并計(jì)算得到指向子設(shè)備的數(shù)據(jù)指針。ZFS這種特性使得RAIDZ缺盤時(shí)無法直接通過校驗(yàn)獲取到數(shù)據(jù),必須將整個ZPOOL作為一個整體進(jìn)行解析。
4、手工截取事務(wù)塊數(shù)據(jù),北亞數(shù)據(jù)恢復(fù)工程師編寫程序獲取最大事務(wù)號入口:
北亞數(shù)據(jù)恢復(fù)——zfs文件系統(tǒng)數(shù)據(jù)恢復(fù)
獲取文件系統(tǒng)入口
5、獲取到文件系統(tǒng)入口后,北亞數(shù)據(jù)恢復(fù)工程師編寫數(shù)據(jù)指針解析程序解析地址:
北亞數(shù)據(jù)恢復(fù)——zfs文件系統(tǒng)數(shù)據(jù)恢復(fù)
解析數(shù)據(jù)指針
6、獲取到文件系統(tǒng)入口點(diǎn)在各磁盤的分布情況后,北亞數(shù)據(jù)恢復(fù)工程師手工截取并分析文件系統(tǒng)內(nèi)部結(jié)構(gòu),發(fā)現(xiàn)入口分布所在的磁盤組無缺失盤,可直接提取信息。根據(jù)ZFS文件系統(tǒng)的數(shù)據(jù)存儲結(jié)構(gòu)順利找到映射的LUN名稱,最終找到其節(jié)點(diǎn)。
7、經(jīng)過分析發(fā)現(xiàn)在此故障服務(wù)器采用的ZFS文件系統(tǒng)版本與開源版本有較大差別,北亞數(shù)據(jù)恢復(fù)工程師重新編寫了數(shù)據(jù)提取程序。由于磁盤組內(nèi)缺盤數(shù)目比較多,每個IO流都需要通過校驗(yàn)得到,提取進(jìn)度極為緩慢。
北亞數(shù)據(jù)恢復(fù)——zfs文件系統(tǒng)數(shù)據(jù)恢復(fù)
8、與用戶溝通得知ZVOL卷映射到XenServer作為存儲設(shè)備,用戶所需的文件在其中一個大小約為2T的vhd內(nèi)。提取ZVOL卷頭部信息,按照XenStore卷存儲結(jié)構(gòu)進(jìn)行分析后發(fā)現(xiàn)這個2T的vhd在整個卷的尾部,通過計(jì)算找到這個2T的vhd的起始位置,然后從此位置開始提取數(shù)據(jù)。
9、Vhd提取完畢后對其內(nèi)部的壓縮包、圖片、視頻等文件進(jìn)行驗(yàn)證,均可正常打開。讓用戶親自驗(yàn)證數(shù)據(jù),結(jié)果發(fā)現(xiàn)恢復(fù)出來的文件數(shù)量與系統(tǒng)自動記錄的文件數(shù)量幾乎相同,丟失的極小數(shù)量的文件可能是因?yàn)槭?a href="http://www.qldv.cn/article/zt/" target="_blank">最新生成還未刷新到磁盤。文件全部可正常打開,本次數(shù)據(jù)恢復(fù)完成。
審核編輯:湯梓紅
-
硬盤
+關(guān)注
關(guān)注
3文章
1317瀏覽量
57494 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9308瀏覽量
86071 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
586瀏覽量
17634
發(fā)布評論請先 登錄
相關(guān)推薦
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器硬盤燈閃黃燈的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—ZFS文件系統(tǒng)下RAIDZ數(shù)據(jù)恢復(fù)案例
![<b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—ZFS文件系統(tǒng)下<b class='flag-5'>RAIDZ</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例](https://file1.elecfans.com/web3/M00/03/05/wKgZPGdjr12AIq8BAAEK1kJhCPk598.png)
服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列兩塊硬盤離線崩潰,數(shù)據(jù)如何起死回生?
![<b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—RAID5陣列兩<b class='flag-5'>塊</b><b class='flag-5'>硬盤</b><b class='flag-5'>離線</b>崩潰,<b class='flag-5'>數(shù)據(jù)</b>如何起死回生?](https://file1.elecfans.com/web3/M00/01/E0/wKgZO2dZH-uAM31dAADa9_os3zs738.png)
服務(wù)器數(shù)據(jù)恢復(fù)—raid5熱備盤上線過程中又有磁盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復(fù)案例
![<b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—RAID5陣列<b class='flag-5'>硬盤</b><b class='flag-5'>離線</b>但熱備盤未激活的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例](https://file1.elecfans.com/web2/M00/8D/A3/wKgaomS-P5qABpvpAAJHt7YF-2Q139.png)
服務(wù)器數(shù)據(jù)恢復(fù)—Linux網(wǎng)站服務(wù)器硬盤出現(xiàn)壞扇區(qū)的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—硬盤出現(xiàn)壞扇區(qū)導(dǎo)致網(wǎng)站服務(wù)器宕機(jī)的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器硬盤狀態(tài)燈亮紅色,raid癱瘓的數(shù)據(jù)恢復(fù)案例
![<b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>服務(wù)器</b><b class='flag-5'>硬盤</b>狀態(tài)燈亮紅色,raid癱瘓的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例](https://file1.elecfans.com/web2/M00/F2/37/wKgZomZ41TiALr9_AAIGtfDuLSk839.png)
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列硬盤離線且熱備盤未激活的數(shù)據(jù)恢復(fù)案例
![<b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—raid5陣列<b class='flag-5'>硬盤</b><b class='flag-5'>離線</b>且熱備盤未激活的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例](https://file1.elecfans.com/web2/M00/EC/35/wKgZomZhfCSAUxUVAAHViov44ZE370.png)
服務(wù)器數(shù)據(jù)恢復(fù)—光纖存儲中raid5出現(xiàn)故障的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—V7000存儲多塊硬盤掉線導(dǎo)致存儲崩潰的數(shù)據(jù)恢復(fù)案例
![<b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—V7000存儲<b class='flag-5'>多</b><b class='flag-5'>塊</b><b class='flag-5'>硬盤</b>掉線導(dǎo)致存儲崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例](https://file.elecfans.com/web2/M00/6C/EC/poYBAGMzwF6AZskyAAF7vwk3l70303.png)
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器硬盤燈顯示紅色,服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
![<b class='flag-5'>服務(wù)器</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>—<b class='flag-5'>服務(wù)器</b><b class='flag-5'>硬盤</b>燈顯示紅色,<b class='flag-5'>服務(wù)器</b>崩潰的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>恢復(fù)</b>案例](https://file1.elecfans.com/web2/M00/C4/78/wKgZomXzvXuAEFGcAAKmpuubElY738.png)
評論