-
雙機容錯
鎖定
- 中文名
- 雙機容錯
- 目 的
- 保證數據永不丟失和系統永不停機
- 通 過
- 軟硬件的緊密配合
- 提供給客户
- 一套具有單點故障容錯能力
雙機容錯雙機容錯概述
雙機容錯基本知識
雙機容錯是為了保障服務器工作不間斷運行而出現的,簡單的説,是兩種功能的綜合:監控功能和切換功能,其基本工作原理是服務器間通過軟件監控服務器的CPU或應用,並互相不斷髮出信號。當某服務器發生中斷,其它服務器接收不到其發出一信號時,軟件的切換功能發生作用,將中斷服務器的工作在指定服務器上啓動起來,使服務器的工作得以繼續。 雙機容錯實際上是集羣容錯的特例,雙機指兩台服務器間,集羣指多台服務器間,兩者區別主要在於服務器數據數量的不同。
雙機容錯原因
要分析為什麼採用雙機容錯,首先應先了解為什麼服務器會發生停頓。服務器停頓原因大致可分為7類;
(1)按計劃的硬件、操作系統進行維護,如增加硬盤、安裝操作系統補丁等;
(2)應用失效,如數據庫出錯等;
(3)操作員出錯,如誤操作等人為錯誤;
(4)操作系統故障,如操作系統死機等;
(5)硬件故障,如硬盤、網卡損壞等;
(6)斷電(沒有UPS的情況);
(7)自然災害,如火災、地震、洪水等。
從上面的説明可以看出,在停頓原因中軟件的因素佔到了絕大多數,而硬件原因只佔其中的一小部分原因,這就是為什麼説可以監控應用的容錯軟件有着比監控硬件的熱備份軟件更好的性能的原因。操作員出錯即人為錯誤,使用純軟件方式可以部分消除該錯誤,如誤關機、操作系統文件的誤刪除等,因為數據是分別存儲於不同服務器上,所以對於沒有損傷到複製文件的誤操作不會產生影響的。對於硬件故障,共享磁盤陣列櫃的熱備份軟件雖然對硬件進行監控但也只能部分消除,而熱備份軟件主要是對CPU的監控,對於如磁盤陣列櫃的錯誤、磁盤的損壞等無能為力,但純軟件方式可以做到。對於斷電(沒有UPS的情況),純軟件方式可以部分解決,因為這種方式的服務器之間有距離,只要不是同時斷電就可以解決。自然災害可以用純軟件方式部分解決,同樣是因為服務器之間有距離,如火災等。
雙機容錯與集羣技術提供了比磁盤陣列更好的性能以及更多的功能。當一台主機出現故障,可及時啓動另一台主機接替原主機任務,保證了用户數據的可靠性和系統的持續運行,它主要是解決的問題是保持計算機應用軟件系統的連續運作。對於一些櫃枱業務系統,大數據量連續處理系統來説,這種數據管理是必不可少的。
目前,這項技術已在各行各業得到廣泛的應用。
雙機容錯模式
雙機容錯雙機熱備份
所謂的雙機熱備份,就是一台主機為工作機,另一台主機為備份機,在系統正常情況下,工作機為信息系統提供支持,備份機監視工作機的運行情況,工作機也同時監視備份機是否正常,有時備份機因某種原因出現異常,工作機可儘早通知系統管理工作人員解決,確保下一次切換的可靠性。當工作機出現異常,不能支持信息系統運營時,備份機主動接管工作機的工作,繼續支持信息的運營,從而保證信息系統能夠不間斷地運行。當工作機經過維修恢復正常後,它會將其先前的工作自動抓回,恢復以前正常時的工作狀態。
雙機容錯雙機互備援
所謂雙機互備援,就是兩台服務器均為工作機,在正常情況下,兩台工作機均為信息系統提供支持,並互相監視對方的運行情況。當一台主機出現異常時,不能支持信息系統正常運營,另一台主機則主動接管異常機的工作,繼續支持信息的運營,從而保證信息系統能夠不間斷地運行,而達到不停機的功能,但正常運行主機的負載會有所增加。此時必須儘快將異常機修復,以縮短正常機負載持續時間。當異常機經過維修恢復正常後,它會自動抓回先前的工作,恢復以前正常時的工作狀態。
雙機容錯雙機容錯示例
易騰數信公司的雙機容錯軟件(EterneCluster-DN)為此提供了一套完美的解決方案。軟件通過兩台服務器間心跳連線感知對方的工作狀態,及時有效的瞭解服務器現實狀況並能將故障機的工作以最快的速度切換至備用服務器上運行,保證了數據和業務的連續性,也同時保證了客户們的最根本利益,為用户節省大量的開支。