複製鏈接
請複製以下鏈接發送給好友

備份

(計算機術語)

鎖定
如果系統的硬件或存儲媒體發生故障,“備份”工具可以幫助您保護數據免受意外的損失。例如,可以使用“備份”創建硬盤中數據的副本,然後將數據存儲到其他存儲設備。備份存儲媒體既可以是邏輯驅動器(如硬盤)、獨立的存儲設備(如可移動磁盤),也可以是由自動轉換器組織和控制的整個磁盤庫或磁帶庫。如果硬盤上的原始數據被意外刪除或覆蓋,或因為硬盤故障而不能訪問該數據,那麼您可以十分方便的從存檔副本中還原該數據。
中文名
備份
外文名
back-up
備份對象
文件、數據
作    用
防止數據的丟失
存儲媒體
硬盤、可移動磁盤等
所屬領域
計算機

備份基本含義

備份:為應付文件、數據丟失或損壞等可能出現的意外情況,將電子計算機存儲設備中的數據複製到磁帶等大容量存儲設備中。
圖1 備份 圖1 備份
從而在原文中獨立出來單獨貯存的程序或文件副本。(摘自《計算機科學》)

備份備份分類

備份可以分為系統備份和數據備份。
1、系統備份:指的是用户操作系統因磁盤損傷或損壞,計算機病毒或人為誤刪除等原因造成的系統文件丟失,從而造成計算機操作系統不能正常引導,因此使用系統備份,將操作系統事先貯存起來,用於故障後的後備支援。
2、數據備份:指的是用户將數據包括文件,數據庫,應用程序等貯存起來,用於數據恢復時使用。

備份備份作用

備份的作用是用於後備支援,替補使用。
備份是容災的基礎,是指為防止系統出現操作失誤或系統故障導致數據丟失,而將全部或部分數據集合從應用主機的硬盤或陣列複製到其它的存儲介質的過程。傳統的數據備份主要是採用內置或外置的磁帶機進行冷備份。但是這種方式只能防止操作失誤等人為故障,而且其恢復時間也很長。隨着技術的不斷髮展,數據的海量增加,不少的企業開始採用網絡備份。網絡備份一般通過專業的數據存儲管理軟件結合相應的硬件和存儲設備來實現。

備份備份方式

比較常見的備份方式有:
定期磁帶備份數據。
遠程磁帶庫、光盤庫備份。即將數據傳送到遠程備份中心製作完整的備份磁帶或光盤。 [1] 
遠程關鍵數據+磁帶備份。採用磁帶備份數據,生產機實時向備份機發送關鍵數據。
遠程數據庫備份。就是在與主數據庫所在生產機相分離的備份機上建立主數據庫的一個拷貝
網絡數據鏡像。這種方式是對生產系統的數據庫數據和所需跟蹤的重要目標文件的更新進行監控與跟蹤,並將更新日誌實時通過網絡傳送到備份系統,備份系統則根據日誌對磁盤進行更新。
遠程鏡像磁盤。通過高速光纖通道線路和磁盤控制技術將鏡像磁盤延伸到遠離生產機的地方,鏡像磁盤數據與主磁盤數據完全一致,更新方式為同步或異步。
數據備份必須要考慮到數據恢復的問題,包括採用 [2]  雙機熱備磁盤鏡像或容錯、備份磁帶異地存放、關鍵部件冗餘等多種災難預防措施。這些措施能夠在系統發生故障後進行系統恢復。但是這些措施一般只能處理計算機單點故障,對區域性、毀滅性災難則束手無策,也不具備災難恢復能力。

備份備份技術

備份系統災難恢復

圖2 圖2
(IDR=Intelligent Disaster Recovery ) 系統災難恢復,就是在系統出現崩潰的時候,能夠用非常少的步驟,將系統重建,包括上面的系統補丁、應用軟件和數據。這樣可以提高恢復的準確性、縮短恢復時間、縮短業務中斷時間。
主要 [3]  災備技術,在恢復的時候有這麼幾種方式:
採用公用的一張光盤,所有的系統都採用這一張光盤。這個光盤可以啓動系統,同時可以啓動網絡,然後備份服務器將備份在磁帶庫(或者虛擬帶庫)中的整個硬盤內容或者第一主分區內容恢復到災難機。這樣不論災難機原來有多大容量數據,都可以存放在整個備份系統的備份設備中,統一進行管理,而且不需要經常刻光盤,也就是説光盤不需要經常更新。比較典型的代表是BakBone NetVault VaultDR。圖2是BakBoneNetVault VaultDR災難備份和恢復的數據流,所有系統採用統一的光盤進行。
需要針對每台計算機單獨刻光盤,恢復的時候需要利用針對性的光盤來恢復,每台機器都需要自己的光盤,而且需要定期不斷更新。這種方式的最大不足是經常要刻光盤,否則災難出現的時候如果沒有光盤或者光盤太久了,都會影響恢復的速度和恢復後的狀態。這種技術的典型代表是EMC NetWork Recovery Manager模塊。
恢復時需要藉助網絡啓動,也就是需要具備一台相同操作系統的主機作為引導機器,然後利用備份的內容進行恢復。這種技術的典型代表是Symantec NetBackup的Bare Metal Restore(裸金屬恢復)模塊。
操作系統自己提供的災備工具。對於大多數Unix小型機,都提供系統備份工具。藉助於系統自身提供的磁帶機,利用一個簡單的命令,HP-UX採用make_recovery就可以把整個root卷備份到服務器自帶的4mm磁帶上。在恢復的時候,這盤磁帶可以自啓動系統,採用一個命令就可以將整個root卷恢復到硬盤上。這種方式的好處是簡單和經濟,尤其對於Unix系統,這樣的方式遠比備份軟件提供的BMR模塊方便、安全和經濟,因為備份軟件提供的BMR模塊往往需要相同平台的其他服務器來啓動。

備份數據遠程複製

將數據在另外的地方實時產生一份可用的副本,此副本的使用不需要做數據恢復,可以將副本立即投入使用。數據複製的最大好處是副本數據立即可用,沒有數據恢復時間,RTO 非常好,同時因為是實時複製,RPO也非常好,幾乎不會丟失數據。缺點是費用遠比數據備份要高,不僅僅是數據複製系統價格高,還需要另外的硬盤存儲空間和主機系統,甚至建立另外的遠程機房,考慮網絡佈線,這些都將帶來成本大大增加,所以數據複製的建設和維護費用遠遠大於數據備份。
數據複製目前有如下實現方式:
基於主機。基於主機的數據複製技術,可以不考慮存儲系統的同構問題,只要保持主機是相同的操作系統即可,存在支持異構主機之間的數據複製軟件,如BakBone NetVault Replicator就可以支持異構服務器之間的數據複製,可以支持跨越廣域網的遠程實時複製。缺點是需要佔用一點主機資源。
基於存儲系統。利用存儲系統提供的數據複製軟件,複製的數據流通過存儲系統之間傳遞,和主機無關。這種方式的優勢是數據複製不佔用主機資源,不足之處是需要災備中心的存儲系統和生產中心的存儲系統有嚴格的兼容性要求,一般需要來自同一個廠家的存儲系統,這樣對用户的災備中心的存儲系統的選型帶來了限制。
基於光纖交換機。這項技術正在發展中,利用光纖交換機的新功能,或者利用管理軟件控制光纖交換機,對存儲系統進行虛擬化,然後管理軟件對管理的虛擬存儲池進行卷管理、卷複製、卷鏡像等技術,來實現數據的遠程複製。比較典型的有Storag-age,Falcon等。
基於應用的數據複製。這項技術有一定侷限性,都是針對具體的應用。主要利用數據庫自身提供的複製模塊來完成,比如OracleDataGuard,Sybase Replication 等。

備份數據保護技術

CDP(Continuous Data Protection)
CDP 技術是目前最熱門的數據保護技術,它可以捕捉到一切文件級或數據塊級別的數據寫改動,可以對備份對象進行更加細化的粒度的恢復,可以恢復到任意時間點。
CDP技術是一個新興的技術,在很多傳統的備份軟件中都逐漸融入了CDP的技術。比如BakBone NetVault Backup 8.0 追加了TrueCDP模塊,Symantec Backup Exec12.5等。其他公司包括EMC,Symantec都併購了一些CDP的軟件,正在和傳統地備份軟件進行整合,還都在整合中。
CDP技術包括兩種:
Near CDP,就是我們説的準CDP,它的最大特點是隻能恢復部分指定時間點的數據(FPIT,Fixed Point In Time),有點類似於存儲系統的邏輯快照,它無法恢復任意一個時間點。如Symantec 、CommVault、凱備份的CDP都屬於這種類型。
TrueCDP,我們稱之為真正的CDP,它可以恢復指定時間段內的任何一個時間點(APIT,Any Point In Time),而BakBone TrueCDP屬於TrueCDP類型。

備份當前應用情況

如果採用災備方案的分佈在各個行業,不過大家都是按照一定的梯度來使用。
首先採用的是系統災難備份(BMR Bare Metal Recovery),因為這種方案成本最低,只要在建設數據備份系統的時候追加一些模塊就可以完成。不需要附加的存儲空間,也不需要附加的 [4]  容災機房,所以,有條件的用户幾乎都可以實施。只不過有的用户採用操作系統提供的備份工具來輔助,有的用户採用備份軟件提供的災難模塊來完成。這樣的用户數量最大,分佈在各個行業。BakBone 的VaultDR在使用BakBone NetVault的備份軟件用户中被廣泛採用。很多用户非常喜歡BakBone VaultDR不用關心操作系統類型,而且一張標準光盤可以應用到所有Intel x86服務器進行災難備份和恢復。
其次是建立容災系統的用户,大數據量的高端企業普遍採用基於存儲的數據複製技術,比如電信、金融行業。中低端用户普遍採用基於主機的數據複製軟件,成本較低,而且不需要進行嚴苛的存儲系統採購,尤其是BakBone的NetVault Replicator不但可以進行遠程數據複製,而且可以支持異構平台,所以在國內外有廣泛的用户,一些政府部門、電力公司、證券部門、網站公司等都採用這種方式,而且大多運用在Windows、Linux平台。基於存儲交換機層的虛擬存儲技術雖然也在有了一些用户,但是因為此技術起步時間有限,技術成熟度需要進一步驗證,很多用户只是做為試點,沒有大範圍的展開。對於基於應用的數據複製方式,也有部分高端客户在採用,而且也有大量的用户。
對於CDP技術,才剛剛起步,這種技術滿足了很多關心災備的用户的需求,在RTO 和RPO方面都能得到很高的標準,同時還可以進行任意歷史版本的重現,正在被越來越多的用户所關注,相信將來會有非常廣泛的用户。BakBone的TrueCDP可以進行任意時間點的恢復,是真正意義上的CDP,將會比其他準CDP產品有更大的優勢,會被更多關心災備的用户所選用。

備份應用誤區

災備系統因為能夠帶來業務的連續性,正越來被大家所重視,但是在使用過程中也要切記出現一些誤區。
沒有選擇適合自己的。沒有仔細分析和明確業務連續要求,對RTO和RPO沒有進行仔細研究,要麼不做,要做就想追求最全面的,這樣可能忽視了最需要的建設,沒有切實滿足自己的需要。
認為災備系統是萬能的,誇大災備系統的作用,忽視了備份系統、高可用系統的建設。其實各個系統都有自己的作用,需要根據實際需求進行建設。
沒有有步驟分階段的進行災備建設,總想等實際成熟的時候全面建設,甚至還沒有先進行數據備份系統的建設,就開始着手進行災備系統建設。不進行備份系統建設,就沒有滿足數據安全的底線,在關鍵時刻缺少一份完整的數據,而花費大量的財力進行災備系統建設,反而得不償失。
多種災備技術的選用不合理,比如主機系統的資源可以接受基於主機的複製軟件來運行,卻選用了基於存儲系統的設計,造成必須選用相同類型的存儲設備,增加了總體費用。
對BMR系統災難備份總是希望選用備份軟件自帶的BMR模塊。其實,備份軟件自帶的BMR模塊對於Window和Linux比較方便,但並不是對於所有的Unix系統都合適,在Unix系統備份方面,Unix自帶的系統備份工具和自帶的磁帶機就非常方便,一個命令就可以完成系統備份,還不用依賴於其他服務器,遠遠勝於一些備份軟件自帶的BMR模塊,不但操作方便,而且減少費用。

備份未來發展方向

圖3 圖3
未來的技術發展應該是多種技術並存,而且越能滿足客户需求的方式更能得到客户的關注。
未來的發展之一應該是基於主機的異構複製技術會有更廣泛的市場。因為大多數客户具備異構主機環境,支持異構環境的數據複製技術,就可以利用現有環境,各台主機之間互為複製。對於不支持異構環境的複製軟件,就需要購買相同的存儲或者購買相同操作系統的主機進行數據複製,增加了災備的總體費用。
未來的發展之二就是CDP技術。CDP融合了數據備份和數據複製的優點,既可以進行實時數據保護,還可以任意時間點的歷史數據恢復,將會具有更加強大的生命力。隨着TrueCDP和傳統備份軟件的無縫銜接,將會有越來越多的用户採用TrueCDP 進行災備系統建設。圖3是廣為流行的BakBone NetVault TureCDP 備份系統架構圖。

備份備份系統

備份備份系統的作用

很多系統管理員認為,投資建立一個備份任務的管理,較原來複雜的備份系統只是在恢復的時候才起作用有些浪費,並且平時增添了很多的管理任務,這對於企業來説是一個大的浪費。
這個問題是一個大問題,直接涉及到對於一個企業的信息系統的投資回報率(ROI)。當IT系統的重要性非常高,企業的關乎生命的數據都在計算機系統裏面,那麼數據的保護就非常重要,這是其一。另外,實施備份系統並不會帶來更多的管理任務,相反為系統管理員帶來了很多維護上的方便,主要有以下幾點:
備份的自動化,降低由維護員的操作帶來的風險;
數據庫在線備份,保證24×7小時業務運行
文件系統及數據庫數據的時間點恢復,歷史版本管理;
磁帶的複製(Cloning),可降低磁帶的出錯幾率和實現異地容災保存;
網絡備份、LAN-Free及Serverless多種備份方式
系統災難快速恢復。
因此,如果企業必須實現上述功能,而企業又不實施備份系統時,需要的人力及設備的投資如果大於實施備份系統的投資,則該備份系統的投資是可以被接受的。

備份備份系統的功能

用户只需要簡單的備份就可以了,不必要那麼複雜。用户買了很多備份系統中沒有用處的先進技術,沒有必要在系統中實現過多的複雜功能。
備份系統實現的功能是備份技術發展到一定階段的產物,先進技術的出現也由於用户的系統中有這樣的需求。當IT系統發展到一定程度,用户對IT系統的依賴型增強,IT系統的數據量越來越大,對系統備份的要求就水漲船高。但好的備份系統應該有如下的特點:
備份系統可根據應用系統的需要非常容易地進行擴展;
滿足未來的數據量及應用系統升級帶來的備份系統的壓力;
備份系統中,尤其是備份軟件的可升級能力。
總體來説,備份技術已經經歷了幾個發展階段,從傳統的磁帶備份到網絡備份,從SCSI LAN-Free備份到SAN結構的動態共享LANFree備份,直到出現的Serverless備份。可以預見,未來備份產品有以下幾個趨勢:

備份磁盤備份

備份狀況

隨着SATA磁盤價格進一步下降,磁盤的備份優勢逐漸體現出來。EMC已經推出了使用磁盤作為虛擬磁帶庫的產品,在功能上可以替代磁帶庫的功能。筆者認為,該產品的大批量投放市場,會在一定程度上引發備份硬件設備的升級換代。

備份iSCSI技術

該技術可以利用現有的TCP/IP網絡進行數據傳輸,用户可以很方便地實現數據的遠程異地保護。市場上已經出現了較多這樣的產品,相信隨着產品的成熟,會有很多異地備份容災方案會選擇該技術。

備份NDMP協議

NDMP(網絡數據管理協議)作為一種標準,已經發展到了Version 4,支持該協議的產品,可以非常方便地實現NAS服務器數據的快速備份和恢復。對於大數量的小文件,該技術有着得天獨厚的優勢。

備份備份技術

很多的磁盤陣列都提供了SnapShot功能,而對於磁盤陣列上的SnapShot,我們可以充分利用SnapShot技術進行數據的Serverless備份,這對於企業級的大型系統有着十分重要的意義,極大地降低了備份時對於生產系統的資源佔用,並且可以非常快速地恢復。
實現備份介質的生命週期管理
通常每盤磁帶都有一定的使用次數限制,因此,對於磁帶備份系統來説,磁帶使用了一定次數後,就應該摒棄掉,不能用來備份關鍵數據。

備份維護

人們投資購買了全自動的備份系統,目的就是降低維護工作量,只要實施了該系統,維護工作就可以放鬆了,只要過一週或者一個月檢查一下備份的狀態就可以了。
當用户實施了備份系統後,對於備份系統的維護工作仍然非常重要。主要由以下因素決定。
由於很多單位IT系統的主機很多,應用系統很多,並且每套應用系統都有相應的管理和維護人員,備份是各種應用數據備份任務的集中管理。因此對於應用系統較為複雜的用户來説,可以設立備份系統管理員或者存儲備份工程師,對整體備份系統進行維護。
隨着數據量的增大,應用系統的增長,備份策略隨着時間的遷移應進行優化。
備份系統涉及的技術包括操作系統、數據庫、存儲、磁帶庫等諸多技術,因此建議備份系統管理員對各種知識有一定的瞭解,並且除了參加備份系統知識的培訓外,還要參加操作系統、數據庫等產品的專業培訓,以保證應用系統在出現災難時儘快實現數據的恢復。
關鍵數據庫的日常備份如果失敗,可能導致數據庫的掛起。例如,對於 [5]  Oracle數據庫來説,如果不及時對數據庫的“歸檔日誌”進行備份,則會導致整個數據庫的停止。
如果磁帶庫備份系統中有“克隆”的功能,還需要每日將“克隆”的介質取出,放置到異地保存,以利於容災

備份產品

在選擇產品時,備份磁帶庫容量儘可能大,磁帶機速度儘可能快,儘可能使用最先進的技術。
在產品的選擇過程中,性價比是最重要的指標之一,但絕不是全部。建議用户在選擇產品的時候考慮以下幾個因素:
本系統應用數據的類型、數據量、備份策略(全備份增量備份等)及關鍵數據的保留時間決定了磁帶庫的總容量;
備份時間窗口和備份數據量的峯值數據量決定了磁帶機的最低數量;
應用系統的種類和數據類型決定備份時採用哪些技術。
如用NAS設備備份,儘量選擇NDMP備份;SAN架構備份儘量選用磁帶機動態共享;磁盤陣列提供了鏡像或者SNAP功能,可以使用SnapShot備份技術。
磁帶機技術的選擇方面,建議選擇較為通用的設備,對於該磁帶機來説,操作系統及備份軟件對其兼容的程度較好。
由於磁帶機屬於機械設備,故障率較磁盤、光盤等設備要高,因此配置磁帶機時儘量保持冗餘。SATA磁盤技術有了突飛猛進的發展,磁盤備份技術已經成為了發展方向。
硬件設備考慮備件的提供情況及提供商的服務水平,而對於備份軟件來説,提供專業服務及技術支持也是需要考慮的重要因素。
備份軟件應該具有較廣泛的兼容性。

備份數據容災

企業關鍵數據丟失會中斷企業正常商務運行,造成巨大經濟損失。要保護數據,企業需要備份容災系統。但是很多企業在搭建了備份系統之後就認為高枕無憂了,其實還需要搭建容災系統。數據容災與數據備份的聯繫主要體現在以下幾個方面:

備份數據備份基礎

數據備份是數據高可用的最後一道防線,其目的是為了系統數據崩潰時能夠快速的恢復數據。雖然它也算一種容災方案,但這種容災能力非常有限,因為傳統的備份主要是採用數據內置或外置的磁帶機進行 [6]  冷備份,備份磁帶同時也在機房中統一管理,一旦整個機房出現了災難,如火災、盜竊和地震等災難時,這些備份磁帶也隨之銷燬,所存儲的磁帶備份也起不到任何容災功能。

備份容災與備份

真正的數據容災就是要避免傳統冷備份所具有先天不足,它能在災難發生時,全面、及時地恢復整個系統。容災按其容災能力的高低可分為多個層次,例如國際標準SHARE 78 定義的容災系統有七個層次:從最簡單的僅在本地進行磁帶備份,到將備份的磁帶存儲在異地,再到建立應用系統實時切換的異地備份系統,恢復時間也可以從幾天到小時級到分鐘級、秒級或0數據丟失等。
無論是採用哪種容災方案,數據備份還是最基礎的,沒有備份的數據,任何容災方案都沒有現實意義。但光有備份是不夠的,容災也必不可少。容災對於IT而言,就是提供一個能防止各種災難的計算機信息系統。從技術上看,衡量容災系統有兩個主要指標:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了當災難發生時允許丟失的數據量;而RTO則代表了系統恢復的時間。

備份容災不僅是技術

容災是一個工程,而不僅僅是技術。很多客户還停留在對容災技術的關注上,而對容災的流程、規範及其具體措施還不太清楚。也從不對容災方案的可行性進行評估,認為只要建立了容災方案即可高枕無憂,其實這具有很大風險的。特別是在一些中小企業中,認為自己的企業為了數據備份和容災,整年花費了大量的人力和財力,而結果幾年下來根本就沒有發生任何大的災難,於是放鬆了警惕。可一旦發生了災難時,後悔晚矣!這一點國外的跨國公司就做得非常好,儘管幾年下來的確未出現大的災難,備份了那麼磁帶,幾乎沒有派上任何用場,但仍一如既往、非常認真地做好每一步,並且基本上每月都有對現行容災方案的可行性進行評估,進行實地演練。 [7] 

備份數據容災等級

設計一個 [4]  容災備份系統,需要考慮多方面的因素,如備份/恢復數據量大小、應用數據中心和備援數據中心之間的距離和數據傳輸方式、災難發生時所要求的恢復速度、備援中心的管理及投入資金等。根據這些因素和不同的應用場合,常見的容災備份等級有以下四個:

備份本地冷備份

這一級容災備份,實際上就是上面所指的數據備份。它的容災恢復能力最弱,它只在本地進行數據備份,並且被備份的數據磁帶只在本地保存,沒有送往異地。
在這種容災方案中,最常用的設備就是 [8]  磁帶機,當然根據實際需要可以是手工加載磁帶機,也可以是自動加載磁帶機。前者主要適用於存儲數據容量較小的中小型企業。
參考資料