Hadoop的NameNode和SecondaryNameNode的功能描述

原創

2018-12-08 01:28

弄明白了雲計算和大數據以及hadoop的概念，思想交給哲學家，我們來研究一下技術實現

hadoop這個傢伙是怎麼個構造？怎麼實現的大數據存儲？怎麼實現的大數據計算？

首先我們來看構造NameNode和SecondaryNameNode，這倆是hadoop的管理者，

我們來主要研究下這倆小兄弟都做了什麼工作？

舉例說明：現在我要使用hadoop存儲一個640M的數據，hadoop會將這個數據進行拆分，拆分成10份，每一份64M（當然這個64不是固定的可以通過配置文件進行更改）

然後將這10份數（我們起名字D1-D10）據存儲到DataNode上。

假設有DataNode1存儲了D1，DataNode2存儲了D1，D1，D2（爲什麼出來兩個D1兩個D2 這是HDFS的特點，數據備份，防止DataNode1損壞數據丟失）DataNode3存儲了D2，D2，D3.

那麼以上這些信息都會被存儲到NameNode中。NameNode怎麼知道哪一個DataNode保存了哪一些block？是DataNode啓動的時候向NameNode彙報的。

這個地方要說一些NameNode與DataNode的關係，他們是一種主從結構的關係，他們之間是通過心跳建立鏈接互通數據的。一旦心跳鏈接斷開（一方得不到另一方發來的信息，一般是指NameNode得不到DataNode發來的信息），表示DataNode死亡。每一次心跳DataNode都會把我這個數據節點新增的block，待移除的block，無效的block，損壞的block，正在處理的block等信息傳遞到NameNode並得到NameNode的一個反饋完成此次心跳鏈接。

那麼NameNode拿到這些信息後，存儲到哪裏呢？這裏就要說到NameNode的兩個重要文件

fsimage元數據鏡像文件（說白了就是備份）

edits 元數據操作文件（說白了就是日誌）

我們都知道備份是有實踐點的，而日誌會記錄下系統當前最新的操作。所以有了備份和日誌，實際上你就可以確保數據在損壞時最新的狀態。這個時候你可能會說,那是不是要定時的去把備份更新一下啊，不然日誌文件越來越大，備份的數據也會越來越古老。對的！！！應該是有這個操作，而且這個操作必須是個任務，每隔一定的時間就將日誌中的變更同步到備份中。

那誰來做這個操作呢？你或許會說肯定是NameNode啊，這倆文件都在這上面！！！但是不是的，因爲NameNode的主要工作還是對DataNode的管理，或者說給用戶提供操作數據訪問數據的服務！哪還有閒工夫管備份，忙都忙死了...

這個時候，SecondaryNameNode就出現了，這個小夥子就是幫助NameNode根據日誌同步備份的。

也就是說SecondaryNameNode會定時的根據edits文件更新fsimage文件。也正是由於這份工作的特殊性，一旦NameNode死磕了，SecondaryNameNode會立馬變身成爲NameNode，保證系統正常運行。

就說這麼多，沒什麼概念，就是描述一下自己的理解。實際上軟件開發很難用概念去描述。網上技術博客很多，寫的也比這詳細的多，關鍵是理解，希望我上面的描述對你形成自己的理解有一定的幫助。我暫時就理解到這個程度。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

(原創) odoo各版本對視圖中節點groups屬性的處理差別

1.14版(含14)視圖節點groups屬性的處理結果表現在可見性上(invisible)，如果當前用戶不在指定的角色中，則設置可見性標記invisible爲"1" 2.16版(含16)以後對視圖節點groups屬性的處理

2024-06-08 14:35:45

lightdb hash index的性能和限制

　　除了btree外，lightdb是支持hash index的，但是總體來說支持的特性範圍均不如btree索引，比如parallel沒有btree索引智能，不支持=之外的操作，不支持bitmap index scan，不支持哈希唯一索引（

2024-06-08 14:32:04

pathlib and difflib

pathlib.Path("a.crt").write_text(a[0]) p.chmod(0o444) Path.cwd() p.write_bytes(b'Binary file contents') p.read_bytes()

2024-06-08 14:31:34

利用WinSW將Nginx 作爲可正常啓動/停止的windows服務

下載winsw程序，Releases · winsw/winsw (github.com) 將下載的exe文件放置到nginx.exe的同級目錄，名字可以修改爲nginx-service.exe(也可不修改) 新建txt文本文檔，並將其名

漫漫人生路總會錯幾步

2024-06-08 14:30:54

純CSS+單個div實現抖音LOGO

純CSS+單個div就能繪製抖音LOGO 關鍵點：主要藉助了兩個僞元素實現了整體結構，藉助了 drop-shadow 生成一層整體陰影 drop-shadow 只能是單層陰影，所以另一層陰影需要多嘗試 contrast(150%) br

2024-06-08 14:30:14

告別Word，用Python打造你的專業簡歷！

今天給大家介紹下一個在純 python 中構建簡歷的實用工具，工具的連接地址https://github.com/koek67/resume-builder/blob/main/readme.md 用法介紹要求 Python 3.7 或更

2024-06-08 14:24:54

一款.NET開源、免費、實用的多功能原神工具箱（改善桌面端玩家的遊戲體驗）

前言今天大姚給大家分享一款.NET開源（MIT License）、免費、實用的多功能原神工具箱，旨在改善桌面端玩家的遊戲體驗：胡桃工具箱。工具箱介紹胡桃工具箱是一款.NET開源（MIT License）、免費、實用的多功能原神工具箱

2024-06-08 14:24:33

輻射3刷藥

去megaton裏面的屍鬼.那裏買藥, 把破爛賣給他. 然後傳送到其他地圖, 再傳送回來, 他就又有錢和新藥了.繼續賣破爛, 買藥.刷幾次就夠了.

張博的博客

2024-06-08 14:22:03

重新研究go的併發模型.

go裏面可以實現很多併發模型的優雅解決方案. 總結起來. package main import ( "fmt" "time" ) var bufChan chan int = make(chan int, 1000) var

張博的博客

2024-06-08 14:22:03

Python 潮流週刊#54：ChatTTS 強大的文本生成語音模型

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-06-08 14:21:23

kafka知識整理——部署

一、部署（1）zk配置修改zk配置文件config/zookeeper.properties，修改dataDir或端口 dataDir=/home/kafka/kafka3.7/data/zookeeper clientPort=218

2024-06-08 14:16:43

Asp .Net Core 系列：詳解鑑權（身份驗證）以及實現 Cookie、JWT、自定義三種鑑權（含源碼解析）

什麼是鑑權（身份驗證）？ https://learn.microsoft.com/zh-cn/aspnet/core/security/authentication/?view=aspnetcore-8.0 定義鑑權，又稱身份驗證，是

2024-06-08 14:15:33

cdn到oss，根據用戶終端是手機和電腦等不同分別訪問兩套前端代碼

使用規則引擎其中一個配置了很多瀏覽器，另外一個配置匹配所有，這樣就能正常訪問。如果這兩個網站，有一個沒有使用規則引擎，那麼就會兩個網站都匹配上，然後第四條規則目標path和第一條的會拼接起來作爲oss的key,肯定不存在，所以

2024-06-08 14:14:22

Codeforces Round 950 (Div. 3)G. Yasya and the Mysterious Tree（字典樹處理區間異或值）

Problem - G - Codeforces 存個字典樹板子。 1 #include <bits/stdc++.h> 2 3 using i64 = long long; 4 5 constexpr int N

2024-06-08 14:10:12

Codeforces Round 949 (Div. 2)D. Turtle and Multiplication（歐拉路徑、線性篩、思維構造）

Problem - D - Codeforces 思路補充官方正解，主要解釋一下爲什麼可以轉化爲求完全圖的歐拉路徑。題目要求構造的數的種數最少，相當於對於當前的m來說要儘可能構造出最長的序列長度，所以一定儘量要是完全圖。其次要求不

2024-06-08 14:10:12

24小時熱門文章

最新文章

最新評論文章