資源池開啓HA後主機保護機制分析

 在前端時間曾今寫過一篇文章分析過XenServer Resources Pool中開啓HA機制後,導致的主機重啓,Citrix稱之爲Host Fencing,也就是所謂的主機保護機制,用於確保存儲中VM數據的安全性,具體參考另外一篇文章:XenServer Host Self-fense(主機保護)

今天發現了關於在HA情況下,當發生心跳丟失或者管理口連接丟失情況下究竟哪臺主機會重啓的官方說明。

在前一篇文章我們已經分析過了大多數情況下:

  • 存儲心跳正常,但是管理口通信異常。此時,網絡正常和網絡異常的主機基本分爲兩組,數量較少的一組將self-fence。
  • 存儲心跳異常,但是管理口通信正常。此時,hosts將在pool中檢查各主機之間通信是否正常,如果全部OK,那麼xenserver認爲是心跳存儲異常。

這個針對的是資源池中至少有三臺主機,在HA的兩種檢測機制中有任何一種機制異常,能夠在Pool中分出兩組數量不同的主機來,此時,主機數較少的一組將會重啓。

而如果是兩臺主機怎麼辦?

此時,XenServer會比較兩臺主機的UUID,UUID較大的一臺主機將會Host fencing,從而重啓,不管VM是否運行在該主機上。

因爲這種機制,如果VM運行在UUID較大的一臺主機上,而發生故障的是UUID較小的主機時候,就會由於UUID較大主機的重啓,從而導致業務的中斷,所以爲了儘可能的避免該情況,推薦資源池中主機的數量至少爲3臺,從而避免主機由於UUID的大小而導致錯誤的進入重啓流程。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章