Hadoop系統的守護進程

原創

2018-09-03 05:44

Hadoop系統在正常啓動後有五個重要的JVM進程，分別是NameNode，SecondaryNameNode，DataNode，JobTracker，TaskTracker。這五個進程肩負着HDFS在存儲和計算上的各項任務。

NameNode進程

NameNode只有一個，它是整個HDFS的核心。分佈式文件系統的管理者。當然也是HDFS的一個單點瓶頸，如果它掛掉，HDFS就會崩潰，所以對它的保護尤爲重要。secondarynamenode進程可選的，負責創建整個系統的檢查點。

DataNode進程

文件存儲的基本單元。每個節點運行一個。應用程序才訪問文件系統時，先由NameNode提供數據的位置，然後程序去訪問對應的DataNode。

JobTracker進程

1、應用程序將job提交給JobTracker；

2、JobTracker通知NameNode，讓其確定數據的位置；

3、JobTracker確定TaskTacker節點，將work提交給確定好的TaskTracker；

4、TaskTracker一直被JobTracker監控着，如果不按時返回心跳信號或者主動返回失敗，則認爲是執行失敗，將會轉向其他TaskTracker；

5、當work順利執行完畢，JobTracker更新狀態；

6、應用程序可以輪詢JobTracker的狀態。

TaskTracker進程

task指的是Map/Reduce/Shuffle操作。

每個TaskTracker都有一個slot集來標記這個TaskTracker所能接受的task的個數。當JobTracker要分配一個task時，會在DataNode的就近節點中找一個空的slot，把task分配給對應的TaskTracker。當TaskTracker要處理一個task時，會產生一個新的進程來執行它。在執行期間不斷向JobTracker發回心跳信號，執行完畢返回結果。

參考資料：

http://wiki.apache.org/hadoop/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

分佈式系統核心要求：分佈式鎖的重要性及實現方式

線程安全告訴我們無狀態和原子類型是線程安全的，對於分佈式而言我們的狀態修改只能一個入口並且是加鎖的，這樣才能保證在分佈式環境下數據的安全可靠。一、爲什麼要使用分佈式鎖我們在開發應用的時候，如果需要對某一個共享變量進行多線程同步訪問

2020-07-07 14:03:42

Alluxio基於冷熱數據分離的元數據管理策略

文章目錄前言Alluxio內部元數據管理架構Alluxio的支持異步寫出功能的自定義Cache實現引用前言上篇文章末尾，筆者聊到了一種叫做分層元數據管理模式。它主張的思想是將元數據進行分級對待，比如Cache+Persist

Android路上的人

2020-07-07 01:28:48

存儲系統元數據管理演變升級

文章目錄前言初代元數據管理內存式元數據管理分區元數據管理分層級元數據管理引用前言我們知道在一個存儲系統中，不光光只有它所存儲的數據文件重要，它的存儲系統的元數據管理同樣十分的重要。因爲涉及到存儲系統數據訪問操作時，會經過存儲

Android路上的人

2020-07-07 01:28:48

高可用集羣架構 — N+1 模型

目錄文章目錄目錄前言高可用集羣架構高可用集羣模型模型N+1 模型N+1 模型關鍵技術單進程多定時器的設計冗餘節點快速切換技術服務器池多級檢測機制前言本地是對論文《服務器池的高可用 N+1 冗餘結構模型》的學習記錄，詳細請瀏覽

2020-07-05 10:13:28

對ZooKeeper的一些理解

文章目錄 paper：ZooKeeper: Wait-free coordination for Internet-scale systems 今天因爲一些繁雜的事情耽擱了，沒有發出來，後續會補上。 linearizabili

2020-07-05 02:35:11

對Raft共識算法的一些理解

文章目錄爲什麼需要共識算法PaxosRaft選舉Leader (Leader election)日誌副本（Log replication）安全（Safety）選舉限制（Election restriction）提交前一term

2020-07-05 02:35:11

Cassandra的consistency level

在將cassandra的節點配置爲互備以後，某天其中一個節點突然down機了，這個時候發現通過cassandra的thrift api往另外的節點寫數據也沒法成功了。研究了下thrift的api以後，推測估計是跟client的consis

2020-07-04 00:04:34

IPFS和很火的Filecoin挖礦到底是什麼？

很火的Filecoin挖礦到底是什麼？由於比特幣大漲，挖礦項目的火爆，Filecoin挖礦被奉爲神，按比特的挖礦邏輯，投資者與投資機構在項目尚未上線就開始囤礦機，IPFS 礦機之風全國各地開花，聲名顯赫！是一個區塊鏈項目，還是一種加密貨

啊拉丁的鱼

2020-07-03 16:19:54

怎麼學習分佈式系統的知識（一）

怎麼學習分佈式系統的知識分佈式系統學習的大障礙分佈式系統的由來分佈式系統的行業現狀分佈式系統的演變分佈式系統介紹總結1 分佈式解決問題1.1 增加系統的可用性1.2 增加系統的吞吐量2 微服務和SOA都是實現分佈式系統的一種架構方

2020-07-03 04:21:21

【FastDFS】如何打造一款高可用的分佈式文件系統？這次我明白了！！

寫在前面前面我們學習瞭如何基於兩臺服務器搭建FastDFS環境，而往往在生產環境中，需要FastDFS做到高可用，那如何基於FastDFS打造一款高可用的分佈式文件系統呢？別急，今天，我們就一起來基於FastDFS搭建一套高可

2020-07-03 04:11:18

「RPC」簡述RPC

轉載請註明出處：https://blog.csdn.net/jinixin/article/details/80711790 最近工作中一直有用到Thrift，所以想對此做個簡單小結。分爲兩篇，第一篇（即本篇）介紹rpc是什麼、其與h

2020-07-02 15:57:51

「Nginx」簡述Nginx

轉載請註明出處: blog.csdn.net/jinixin/article/details/89894063 Nginx是什麼? 如何配置? 作用有哪些? 這些問題一直困擾着我, 下面做個簡單記錄. 在我的理解中, Nginx是一個

2020-07-02 15:57:51

「Nginx」正向代理與反向代理

轉載請註明出處: blog.csdn.net/jinixin/article/details/89574956 談到正向代理和反向代理, 首先就要先了解代理的概念. 代理, 即代理服務器(Proxy Server), 一般我們會省略”

2020-07-02 15:57:51

一種服務器的負載均衡選取算法

在很多分佈式系統裏面會遇到一個均衡節點選取的問題：一般是1個負載管理服務器，多個應用服務單元。當有連接或者業務來是，先會去詢問負載管理器獲取一個負載輕的服務單元，一般的選取就是選取負載最輕的那個。通常情況下是不會有問題的，如果你的應用服務

2020-07-02 13:55:53

用C/C++實現對STORM的運行信息查看和控制

最近公司有個需求，需要在後端應用服務器上實時獲取STORM集羣的運行信息和topology相關的提交和控制，經過幾天對STORM UI和CMD源碼的分析，得出可以通過其thrift接口調用實現這些功能。先下載一個thrift庫進行編碼和安

2020-07-02 13:55:53

24小時熱門文章

最新文章

最新評論文章