咨詢熱線:13998384184
今天為大家介紹的是服務(wù)器數(shù)據(jù)恢復(fù)案例,服務(wù)器的故障是raid信息丟失了。下面簡(jiǎn)單介紹一下本次數(shù)據(jù)恢復(fù)的服務(wù)器基礎(chǔ)信息:某品牌DL系列服務(wù)器,存儲(chǔ)是由6塊73GB SAS硬盤組成的RAID5磁盤陣列,服務(wù)器上層操作系統(tǒng)是WINDOWS,服務(wù)器內(nèi)主要存儲(chǔ)了企業(yè)的內(nèi)部文件,沒有數(shù)據(jù)庫(kù)文件,在服務(wù)器的主機(jī)(無UPS)發(fā)生故障前曾經(jīng)出現(xiàn)過幾次意外斷電的情況,由于重啟后并沒有出現(xiàn)異常,因此服務(wù)器一直在使用,直到有一次斷電重啟后RAID報(bào)錯(cuò),提示無法找到存儲(chǔ)設(shè)備,進(jìn)入RAID管理模塊后操作死機(jī),管理員多次嘗試重啟服務(wù)器后還是沒有辦法進(jìn)入系統(tǒng),為了防止服務(wù)器內(nèi)數(shù)據(jù)丟失,管理員聯(lián)系到飛客瑞康進(jìn)行服務(wù)器數(shù)據(jù)恢復(fù)。
【數(shù)據(jù)恢復(fù)故障分析】
通常服務(wù)器出現(xiàn)這種情況的數(shù)據(jù)丟失多因?yàn)榉?wù)器意外斷電導(dǎo)致RAID模塊損壞(包括RAID管理信息丟失和RAID模塊硬件損壞)。一般在RAID陣列創(chuàng)建完成后陣列的管理模塊信息就固定下來不會(huì)再發(fā)生改變,但是raid陣列的模塊信息依然屬于可修改部分,服務(wù)器意外斷電很容易造成這部分信息被篡改甚至丟失,多次斷電甚至有可能導(dǎo)致RAID卡上的元器件損壞,從而使主機(jī)失去對(duì)多塊物理硬盤進(jìn)行RAID管理的中間層模塊。該案例中對(duì)RAID模塊的操作死機(jī)現(xiàn)象極有可能是由RAID卡硬件損壞引起的(后經(jīng)HP售后技術(shù)人員驗(yàn)證得到證實(shí)),此時(shí)通過正常途徑已無法將獲取6塊硬盤中的數(shù)據(jù),只能依靠第三方提供數(shù)據(jù)恢復(fù)服務(wù)來解決。
1.服務(wù)器數(shù)據(jù)恢復(fù)第一步首先對(duì)客戶的服務(wù)器內(nèi)所有硬盤進(jìn)行嚴(yán)格的物理檢測(cè),用以排查硬盤是否有硬件故障。經(jīng)過檢查發(fā)現(xiàn)服務(wù)器內(nèi)的所有硬盤均可以正常讀取。
2.由于硬盤全部正常,因此不需要進(jìn)行硬件修復(fù),直接對(duì)服務(wù)器內(nèi)的硬盤進(jìn)行鏡像備份即可。
3.鏡像完成后,服務(wù)器數(shù)據(jù)恢復(fù)工程師開始對(duì)這組raid進(jìn)行結(jié)構(gòu)分析,主要是為了確定raid陣列的硬盤順序、數(shù)據(jù)塊的大小和陣列校驗(yàn)方式等用于重新構(gòu)建raid陣列。
4.服務(wù)器數(shù)據(jù)恢復(fù)工程師利用分析出來的raid陣列信息重新虛擬重建一組raid陣列并進(jìn)行邏輯校驗(yàn),確保重構(gòu)RAID所應(yīng)用的各參數(shù)正確無誤后,針對(duì)用戶最為關(guān)注的數(shù)據(jù)進(jìn)行完全驗(yàn)證;
5.最后,數(shù)據(jù)恢復(fù)工程師聯(lián)系客戶對(duì)恢復(fù)出來的數(shù)據(jù)進(jìn)行驗(yàn)證,經(jīng)過驗(yàn)證后所有數(shù)據(jù)均已經(jīng)成功恢復(fù),數(shù)據(jù)遷移成功后本次數(shù)據(jù)恢復(fù)圓滿結(jié)束。
【服務(wù)器數(shù)據(jù)恢復(fù)過程】
1.盡量保證機(jī)房電源供應(yīng)穩(wěn)定,以減少電源異常對(duì)主機(jī)及存儲(chǔ)的沖擊;
2.最好為重要的服務(wù)器及存儲(chǔ)配置UPS,可在機(jī)房意外斷電的情況下保證核心業(yè)務(wù)系統(tǒng)能繼續(xù)維持一定時(shí)間的正常工作,從而為企業(yè)尋求應(yīng)急解決方案贏得寶貴的時(shí)間;
3.對(duì)于服務(wù)年限已久的服務(wù)器應(yīng)定期進(jìn)行安全狀況檢查,并對(duì)其整體運(yùn)行狀態(tài)進(jìn)行評(píng)估以決定是否進(jìn)行硬件及系統(tǒng)的全面升級(jí),同時(shí)提前制定突發(fā)數(shù)據(jù)災(zāi)難的緊急處理方案,以降低數(shù)據(jù)災(zāi)難帶來的業(yè)務(wù)損失。
熱門文章