- 相關推薦
IBM認證知識:HACMP心跳檢測
與在許多其他類型的集群中一樣,心跳檢測用于監視網絡接口、通信設備和 IP 標簽(服務、非服務和持久 IP 標簽)的可用性,從而監視節點的可用性。
從 HACMP V5.1 開始,心跳檢測完全基于 RSCT 拓撲服務(因而 HACMP V5.1 只是“Enhanced Scalability”版本;使用直接由集群管理器守護進程監視的傳統網絡接口模塊 (NIM) 的心跳檢測已不再使用)。
執行心跳檢測的方法是通過每個通信接口或設備在集群中的節點之間交換消息(Keep Alive 數據包)。
每個集群節點以特定間隔向其他集群節點發送心跳信號消息,并預期以特定間隔接收來自對應節點的心跳信號消息。如果消息接收停止,則 RSCT 將此情況視為故障,并告訴 HACMP,后者將采取適當的恢復操作。
心跳信號消息可通過以下網絡發送:
TCP/IP 網絡點對點非 IP 網絡為了防止集群分割(split brain),HACMP 必須能夠區分節點故障和 TCP/IP 網絡故障。TCP/IP 網絡故障可能由有故障的網絡元素(交換機、集線器和電纜)導致;在這種情況下,集群中的節點不能通過 IP 發送和接收檢測信號消息(Keep Alive,KA),因此每個節點認為對等節點發生了故障,并嘗試獲取資源。這具有潛在的數據破壞風險,在使用并發資源時尤其是如此。
非 IP 網絡是節點之間的直接連接(點對點),并且不使用 IP 來進行檢測信號消息交換,因此不太容易受到 IP 網絡元素故障的影響。如果使用了這些網絡類型,則在 IP 網絡發生故障的情況下,節點仍然能夠交換消息,因此得出的判斷是網絡故障,從而不執行任何資源組活動。
為了避免 HACMP 中發生分割,我們建議:
配置冗余網絡(IP 和非 IP)同時使用 IP 和非 IP 網絡。若要了解一個建議的兩節點集群配置,圖 3。
圖 3 HACMP 集群中的信號檢測
通過磁盤的信號檢測
通過磁盤的心跳檢測 (diskhb) 是 HACMP V5.1 中引入的新功能,旨在提供預防集群分割的附加保護和簡化的非 IP 網絡配置,尤其是用于太難或無法實現 RS232、目標模式 SSA 或目標模式 SCSI 連接的環境。
此類網絡可以使用任何類型的共享磁盤存儲(光纖通道、SCSI 或 SSA),只要用于交換 KA 消息的磁盤是 AIX 增強并發卷組的一部分。用于信號檢測網絡的磁盤并不專門用于此目的;可以將它們用于存儲應用程序共享數據(有關更多信息,請參見圖 3)。
客戶提出了使用目標模式的光纖通道連接請求,但是由于異構(非標準發起設備和目標功能)的 FC 環境(適配器、存儲子系統、SAN 交換機和集線器),此方法很難實現和支持。
通過使用共享磁盤來交換消息,非 IP 網絡的實現更加可靠,并且不依賴所使用的硬件類型。
此外,在 SAN 環境中,當使用光纖來連接設備時,這種非 IP 連接的長度具有與 SAN 相同的距離限制,
因而允許實現超長的點對點網絡。
通過將某個磁盤定義為增強的并發卷組的一部分,該磁盤的一部分(扇區)將不用于任何 LVM 操作,此磁盤部分將用于在兩個節點之間交換消息。
使用通過磁盤的信號檢測的規范如下:
一個磁盤可用于兩個節點之間的一個網絡。同時在兩個節點上使用 LVM 分配的物理卷 ID(physical volume ID,PVID)來標識要使用的磁盤。用于磁盤信號檢測網絡的建議配置是在每個存儲機箱中將一個磁盤用于一對節點。要求將要使用的磁盤是某個增強并發卷組的一部分,雖然該卷組不一定要是活動的或者是某個資源組(并發或非并發)的一部分。唯一的限制在于,必須同時在兩個節點上定義該卷組(volume group,VG)。注意:增強并發卷組的集群鎖機制不使用保留磁盤空間來進行通信(“傳統”版本的 clvmd 要使用保留磁盤空間);它改為使用 RSCT 組服務。
通過 IP 別名的心跳檢測
對于 IP 網絡,現在引入了一個新的心跳檢測功能:通過 IP 別名的信號檢測。此功能是為不能或不適宜更改通信接口的基本 IP 地址的集群而提供的。
用于信號檢測的 IP 別名是在 HACMP 服務啟動時在現有 IP 地址之外配置的。用于此目的的 IP 地址必須與現有的 IP 地址在完全不同的子網中,并且不應該定義用于任何名稱解析(/etc/hosts、BIND 等等)。此配置不需要任何附加的可路由子網。
與使用基本/啟動 IP 地址來交換心跳信號消息不同,RSCT 使用 HACMP 定義的 IP 別名來為每個通信接口建立通信組(檢測信號環)。
注意:在使用通過 IP 別名的心跳檢測時,通信接口的基本/啟動 IP 地址由不由RSCT 拓撲服務(從而由 HACMP)進行監視。通信接口將通過所分配的 IP 別名接受監視。
即使使用此技術,HACMP 仍然要求網絡上的所有接口(所有節點中的接口)能夠彼此通信(能夠彼此看到對方的 MAC 地址)。
用于 IP 別名的子網掩碼與用于服務 IP 地址的子網掩碼相同。在定義用于信號檢測的 IP 地址時,必須指定要用于信號檢測的起始地址,并且必須確保有足夠多與網絡上使用的現有子網不發生沖突的子網可用(節點中的每個物理通信接口對應一個子網)。
【IBM認證知識:HACMP心跳檢測】相關文章:
ibm認證考試知識點06-13
IBM認證考試認證體系01-20
IBM認證項目01-12
IBM認證考試流程01-12
IBM認證的考試流程01-12
IBM認證考試須知06-05
IBM Lotus認證試題03-08
IBM認證證書分類02-24
IBM/Notes認證方式03-10
IBM認證考試介紹01-19