hdfs namenode HA高可用方案

2019/2/18 星期一

hdfs namenode HA高可用方案
1、hadoop-ha 集羣運作機制介紹
所謂HA，即高可用（7*24 小時不中斷服務） //hadoop 2.x 內置了 HA 方案
實現高可用最關鍵的是消除單點故障
hadoop-ha 嚴格來說應該分成各個組件的HA 機制

提示：
在之前沒有HA機制的時候，secondary namenode 和standay namenode 有很大的區別
secondary namenode 不可以替代namenode；而standay namenode 可以完全的替代namenode

HA技術要點：元數據管理 2個namenode的狀態管理如何防止腦裂

HDFS 的HA 機制
通過雙namenode 消除單點故障
雙namenode 協調工作的要點：
A、元數據管理方式需要改變：
內存中各自保存一份元數據
Edits 日誌只能有一份，只有Active 狀態的namenode 節點可以做寫操作
兩個namenode 都可以讀取edits
共享的edits 放在一個共享存儲中管理（qjournal 和NFS 兩個主流實現）
B、需要一個狀態管理功能模塊
實現了一個zkfailover，常駐在每一個namenode 所在的節點
每一個zkfailover 負責監控自己所在的namenode 節點，利用zk 進行狀態標識
當需要進行狀態切換時，由zkfailover 來負責切換
切換時需要防止brain split 現象的發生

什麼是zkfc：就是基於zookeeper實現的失敗切換控制器

如何在狀態切換時避免brain split(腦裂)？

  腦裂：active namenode工作不正常後，zkfc在zookeeper中寫入一些數據，表明異常，這時standby namenode中的zkfc讀到異常信息，並將standby節點置爲active。但是，如果之前的active namenode並沒有真的死掉，出現了假死（死了一會兒後又正常了），這樣，就有兩臺namenode同時工作了。這種現象稱爲腦裂。

 解決方案：standby namenode感知到主用節點出現異常後並不會立即切換狀態，zkfc會首先通過ssh遠程殺死active節點的 namenode進程（kill -9 進程號）。如果在一段時間內standby的namenode節點沒有收到kill執行成功的回執，standby節點會執行一個自定義腳本，儘量保證不會出現腦裂問題！這個機制在hadoop中稱爲fencing（包括ssh發送kill指令，執行自定義腳本兩道保障）。

從解決方案中可知；當發生active節點崩壞時；hadoop會進行以下兩個操作：

1）通過ssh kill掉active節點的namenode進程

2）執行自定義腳本
原文：https://blog.csdn.net/qq_22310551/article/details/85700978

如何沒有及時得到kill的成功返回信息，在調用一個用戶指定的shell腳本程序。

在cdh中這個程序在
HDFS High Availability 防禦方法
dfs.ha.fencing.methods
用於服務防禦的防禦方法列表。shell(./cloudera_manager_agent_fencer.py) 是一種設計爲使用 Cloudera Manager Agent 的防禦機制。sshfence 方法使用 SSH。如果使用自定義防禦程序(可能與共享存儲、電源裝置或網絡交換機通信)，則使用 shell 調用它們。
Cloudera Manager 防禦策略的超時時限
dfs.ha.fencing.cloudera_manager.timeout_millis 10000
基於 Cloudera Manager 代理的防禦程序使用的超時時限（毫秒）

zookeeper在HA機制中的作用
1、QJN集羣需要zk實現協調服務
2、namenode中誰是active誰是standay記錄在zk中
3、zkfc基於zookeeper實現失敗切換控制器

hdfs namenode HA高可用方案

2019/2/18 星期一

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

大齡程序員思考

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

nuget添加readme

重要鏈接彙總

python 鏈接mysql數據庫使用 mysql-connector 方式

hive權限用Sentry詳細使用測試文檔

29 python中列表中的方法(重點) 列表的基本操作（賦值、刪除和分片賦值) 元組

30 字符串的基本操作格式化字符串(%,Template類,format方法*****)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結