複製鏈接
請複製以下鏈接發送給好友

故障轉移羣集

鎖定
故障轉移羣集 (Failover Cluster) 是微軟視窗操作系統 針對服務器提供的一種服務,該服務用於防止單台服務器故障導致服務失效。
中文名
故障轉移羣集
外文名
Failover Cluster
位    置
微軟視窗操作系統
針    對
單台服務器故障導致服務失效

故障轉移羣集故障轉移羣集

故障轉移羣集是一種高可用性的基礎結構層,由多台計算機組成,每台計算機相當於一個冗餘節點,整個羣集系統允許某部分節點掉線、故障或損壞而不影響整個系統的正常運作。一台服務器接管發生故障的服務器的過程通常稱為"故障轉移"。
如果一台服務器變為不可用,則另一台服務器自動接管發生故障的服務器並繼續處理任務。 羣集中的每台服務器在羣集中至少有一台其他服務器確定為其備用服務器。
故障轉移羣集可應用於Windows server 2003Windows server 2008、Windows 2012 server等操作系統中部署。

故障轉移羣集適用環境

  1. 硬件組件、應用程序或服務出現故障導致程序或服務無法使用或影響工作;例如某服務器電源出現故障,如果該該服務器和電源都是唯一的,則存在單點故障,並且服務器提供的應用程序將不可用。
  2. 計劃內的服務器停機或維護影響應用程序的可用性;例如要更新無備用服務器的一台數據庫服務器上的操作系統,你可能需要重啓或停止應用程序服務才能安裝更新修補程序;
  3. 監視和維護多服務器層增加了對系統和網絡資源的要求。例如你需要多台服務器提供多種應用程序服務,各自獨立的服務器不利於監視與維護;

故障轉移羣集工作原理

故障轉移羣集必須基於域的管理模式部署,以“心跳機制”來監視各個節點的健康狀況;備用服務器以心跳信號來確定活動服務器是否正常,要讓備用服務器變成活動服務器,它必須確定活動服務器不再正常工作。

故障轉移羣集同步狀態

備用服務器必須首先將其狀態與發生故障的服務器的狀態進行同步,然後才能開始處理事務。 主要有三種不同的同步方法:
  • 事務日誌。在事務日誌方法中,活動服務器將其狀態的所有更改記錄到日誌中。 一個同步實用工具定期處理此日誌,以更新備用服務器的狀態,使其與活動服務器的狀態一致。 當活動服務器發生故障時,備用服務器必須使用此同步實用工具處理自上次更新以來事務日誌中的任何添加內容。 在對狀態進行同步之後,備用服務器就成為活動服務器,並開始處理事務。
  • 熱備用。在熱備用方法中,將把活動服務器內部狀態的更新立即複製到備用服務器。 因為備用服務器的狀態是活動服務器狀態的克隆,所以備用服務器可以立即成為活動服務器,並開始處理事務。
  • 共享存儲。在共享存儲方法中,兩台服務器都在共享存儲設備(如存儲區域網絡或雙主機磁盤陣列)上記錄其狀態。 這樣,因為不需要進行狀態同步,故障轉移可以立即發生。

故障轉移羣集示 例

示例圖 示例圖
第一台服務器 (Database01) 是處理所有事務的活動服務器。 僅當 Database01 發生故障時,處於空閒狀態的第二台服務器 (Database02) 才會處理事務。 羣集將一個虛擬 IP 地址和主機名 (Database10) 在客户端和應用程序所使用的網絡上公開。

故障轉移羣集部署過程

故障轉移羣集基本條件

  1. 兩台加入域管理模式的計算機,windows server 2003或以上服務器操作系統;
  2. 能作為共享存儲卷的設備作為仲裁磁盤;(例如支持iscsi協議的NAS或軟件)
  3. 每台計算機有獨立作為傳輸心跳信號的網卡;

故障轉移羣集注意要點

(以Windows Server 2008為例)
  1. 首注意網卡綁定順序,以域網絡優先;
  2. 禁用心跳線網絡 NETBIOS;和一些無關的協議及服務;
  3. 各節點能通過域主機名相互通信(域內DNS作用);
  4. 共享磁盤、仲裁磁盤可多鏈路使用;
  5. 嚴格執行羣集測試要求;
  6. 各個節點的系統補丁和版本一致;
  7. 故障轉移羣集不能與NLB負載均衡共處於一台邏輯計算機的系統上(可以用虛擬機分擔);
  8. 防火牆會阻擋羣集通訊,需要配置允許羣集和域相關服務通過;
  9. 安裝虛擬網卡有可能導致MAC地址一樣無法建立羣集;
  10. 域控制器不建議安裝在羣集節點上。