hdfs的HA以及Yarn的HA高可用

原創

五分钟学大数据

2021-05-07 11:03

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\tHA(High Available), 高可用，是保證業務連續性的有效解決方案，一般有兩個或兩個以上的節點，分爲活動節點（Active）及備用節點（Standby）。通常把正在執行業務的稱爲活動節點，而作爲活動節點的一個備份的則稱爲備用節點。當活動節點出現問題，導致正在運行的業務（任務）不能正常運行時，備用節點此時就會偵測到，並立即接續活動節點來執行業務。從而實現業務的不中斷或短暫中斷。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\tHadoop1.X版本，NN是HDFS集羣的單點故障點，每一個集羣只有一個NN,如果這個機器或進程不可用，整個集羣就無法使用。爲了解決這個問題，出現了一堆針對HDFS HA的解決方案（如：Linux HA, VMware FT, shared NAS+NFS, BookKeeper, ","attrs":{}},{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"QJM/Quorum Journal Manager","attrs":{}},{"type":"text","text":", BackupNode等）。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t在HA具體實現方法不同情況下，HA框架的流程是一致的, 不一致的就是如何存儲、管理、同步edits編輯日誌文件。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t在Active NN和Standby NN之間要有個共享的存儲日誌的地方，Active NN把edit Log寫到這個共享的存儲日誌的地方，Standby NN去讀取日誌然後執行，這樣Active和Standby NN內存中的HDFS元數據保持着同步。一旦發生主從切換Standby NN可以儘快接管Active NN的工作。","attrs":{}}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"9.1 Namenode HA介紹","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\thadoop2.x之後，Clouera提出了QJM/Qurom Journal Manager，這是一個基於Paxos算法（分佈式一致性算法）實現的HDFS HA方案，它給出了一種較好的解決思路和方案,QJM主要優勢如下：","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t不需要配置額外的高共享存儲，降低了複雜度和維護成本。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t消除spof(單點故障)。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t系統魯棒性(Robust)的程度可配置、可擴展。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t基本原理就是用2N+1臺 JournalNode 存儲EditLog，每次寫數據操作有>=N+1返回成功時即認爲該次寫成功，數據不會丟失了。當然這個算法所能容忍的是最多有N臺機器掛掉，如果多於N臺掛掉，這個算法就失效了。這個原理是基於Paxos算法。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t在HA架構裏面SecondaryNameNode已經不存在了，爲了保持standby NN時時的與Active NN的元數據保持一致，他們之間交互通過JournalNode進行操作同步。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t任何修改操作在 Active NN上執行時，JournalNode進程同時也會記錄修改log到至少半數以上的JN中，這時 Standby NN 監測到JN 裏面的同步log發生變化了會讀取 JN 裏面的修改log，然後同步到自己的目錄鏡像樹裏面，如下圖：","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t當發生故障時，Active的 NN 掛掉後，Standby NN 會在它成爲Active NN 前，讀取所有的JN裏面的修改日誌，這樣就能高可靠的保證與掛掉的NN的目錄鏡像樹一致，然後無縫的接替它的職責，維護來自客戶端請求，從而達到一個高可用的目的。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t在HA模式下，datanode需要確保同一時間有且只有一個NN能命令DN。爲此：","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t每個NN改變狀態的時候，向DN發送自己的狀態和一個序列號。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\tDN在運行過程中維護此序列號，當failover時，新的NN在返回DN心跳時會返回自己的active狀態和一個更大的序列號。DN接收到這個返回則認爲該NN爲新的active。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t如果這時原來的active NN恢復，返回給DN的心跳信息包含active狀態和原來的序列號，這時DN就會拒絕這個NN的命令。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Failover Controller :","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\tHA模式下，會將FailoverController部署在每個NameNode的節點上，作爲一個單獨的進程用來監視NN的健康狀態。","attrs":{}},{"type":"text","marks":[{"type":"strong","attrs":{}}],"text":"FailoverController主要包括三個組件:","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\tHealthMonitor: 監控NameNode是否處於unavailable或unhealthy狀態。當前通過RPC調用NN相應的方法完成。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\tActiveStandbyElector: 監控NN在ZK中的狀態。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\tZKFailoverController: 訂閱HealthMonitor 和ActiveStandbyElector 的事件，並管理NN的狀態,另外zkfc還負責解決fencing（也就是腦裂問題）。","attrs":{}}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"\t上述三個組件都在跑在一個JVM中，這個JVM與NN的JVM在同一個機器上。但是兩個獨立的進程。一個典型的HA集羣，有兩個NN組成，每個NN都有自己的ZKFC進程。","attrs":{}}]}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Java中的Semaphore和CountDownLatch這兩個工具類的使用方法和實際應用場景

在現代的多線程編程中，Semaphore和CountDownLatch是兩個非常常見和重要的工具類，它們都可以用來實現多線程間的同步和互斥，提高程序的併發性能和效率。本文將詳細介紹Java中的Semaphore和CountDownLatch

2024-04-20 00:54:00

MySQL 創建表後神祕消失？揭祕零寬字符陷阱

三招教你解決零寬字符陷阱，讓你的數據庫不再”鬧鬼“。作者：秦福朗，愛可生 DBA 團隊成員，負責項目日常問題處理及公司平臺問題排查。熱愛互聯網，會攝影、懂廚藝，不會廚藝的 DBA 不是好司機，didi~ 愛可生開源社區出品，原創內容未經

2024-04-19 23:21:06

手動給docusaurus添加一個搜索

新版博客用docusaurus重構已經有些日子了，根據docusaurus的文檔上也申請了Algolia,想一勞永逸的解決博客的搜索問題。但是流水有意，落花無情。 algolia總是不給我回復，我只能對着algolia的申請頁面仰天長嘆。

2024-04-19 21:30:54

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

AI安全啓示錄：銀行最常遇到的五類AI攻擊手段

根據麥肯錫研究所的數據，基於AI的身份欺詐已成爲美國增長最快的金融犯罪類型，並且在全球範圍內呈上升趨勢。英國GDG的研究表明，英國有超過860萬人使用虛假或他人的身份來獲取商品、服務或信貸。美國財政部近日發佈在一份題爲《金融服務業中特定於

2024-04-18 23:33:14

庫存領域核心能力--庫存預佔建設實踐

前言本文總結庫存領域建設庫存預佔能力時遇到的問題以及解決方案。感謝【金鵬】、【孫靜】、【陳瑞】同學在本文撰寫中提供的內容及幫助！ 1、庫存預佔業務概述消費者拍下商品訂單後，庫存系統先爲該訂單預留庫存，這個預留庫存的動作被稱爲庫存預佔

2024-04-18 23:17:21

微服務架構下如何通過弱依賴原則保障系統高可用

前言當我初次接觸高可用這個概念的時候，對高可用的【少依賴原則】和【弱依賴原則】的邊界感模糊，甚至有些“傻傻分不清楚”。這兩個原則都關注降低模塊之間的依賴關係，但它們之間的確存在某些差異。那麼，「少依賴原則」和「弱依賴原則」它們之間本質

2024-04-18 23:17:20

O2OA(翱途)開發平臺新手上路-信息管理和信息欄目開發

本篇主要使用實例開發的方式講述如何在O2OA(翱途)開發平臺中開發一個簡單的通知公告，包括欄目創建，分類設置，表單設計以及如何驗證表單開發成果。一、先決條件： 1、O2Server服務器正常運行 2、以擁有管理員權限的用戶賬號登錄O

2024-04-18 22:25:54

勞動節H5好難做？那是你沒看到這些模板！

隨着勞動節的步伐越來越近各大門店開始爭相公佈各自的促銷活動了各類社交媒體上的節日宣傳海報也陸續多了起來線下線上到處洋溢着濃郁的營銷氣息衆所周知，營銷宜早不宜遲再不出手，就要出局啦這個時候，我猜大家一定都缺這樣一波勞動

2024-04-18 22:24:40

New！界面控件DevExpress WinForms v24.1預覽版搶先體驗

DevExpress WinForm擁有180+組件和UI庫，能爲Windows Forms平臺創建具有影響力的業務解決方案。DevExpress WinForms能完美構建流暢、美觀且易於使用的應用程序，無論是Office風格的界面，還是

2024-04-18 11:35:17

文心大模型ERNIE-Tiny：輕量化技術的全面解讀

隨着人工智能技術的日益成熟，大模型成爲了衆多領域的研究熱點。大模型通過龐大的數據量和複雜的網絡結構，實現了對數據的深度挖掘和高效處理。然而，大模型的龐大體積和高計算成本也限制了其在一些實際場景中的應用。爲了解決這一問題，文心大模型ERNIE

2024-04-18 11:29:53

Open WebUI大模型對話平臺：適配Ollama的實踐與探索

隨着人工智能技術的飛速發展，大模型對話平臺成爲了衆多領域中的熱門話題。Open WebUI大模型對話平臺作爲一款功能強大的工具，爲我們提供了一種無縫集成文檔交互、輕鬆訪問Web內容、訓練模型以及實現多模態交互的方式。在本文中，我們將深入探討

2024-04-18 11:29:51

Qt/C++音視頻開發70-無感切換通道/無縫切換播放視頻/多通道流暢切換/不同視頻打開無縫切換

一、前言之前就寫過這個方案，當時做的是ffmpeg內核版本，由於ffmpeg內核解析都是代碼實現，所以無縫切換非常完美，看不到絲毫的中間切換過程，看起來就像是在一個通道畫面中。其實這種切換隻能說是取巧辦法，最佳的辦法應該是公用一個open

2024-04-18 10:40:53

架構設計｜基於 raft-listener 實現實時同步的主備集羣

背景以及需求線上業務對數據庫可用性可靠性要求較高，要求需要有雙 AZ 的主備容災機制。主備集羣要求數據和 schema 信息實時同步，數據同步平均時延要求在 1s 之內，p99 要求在 2s 之內。主備集羣數據要求一致要求能夠在主

2024-04-18 01:07:18

一款國產的開發輔助AI插件！

@[toc] 昨天百度舉行了 Create 2024 百度 AI 開發者大會，松哥得以近距離了解了百度的 AI 產品，以前就瞭解文心一言，其他的都用的少。昨天在會場上李彥宏介紹了百度的一個 AI 輔助工具 Comate，晚上回來趕緊體驗了一

2024-04-18 00:15:13

24小時熱門文章

最新文章

最新評論文章