HDFS基本原理

原創

2018-09-15 01:36

HDFS（Hadoop Distributed File System ）Hadoop分佈式文件系統，是Google 文件系統GFS（Google File System）的開源實現。

HDFS有很多特點：

簡單的文件模型。
兼容廉價的硬件設備。
適合大數據處理。
數據流讀寫。
強大的跨平臺兼容性。

在實現上述特點的同時，也使得自身具有一些應用侷限性，主要包括;

不適合低延遲數據訪問。
無法高效存儲大量小文件。
不支持多用戶寫入及任意修改文件。

體系結構

如上圖所示，HDFS也是按照Master和Slave的結構。分NameNode、SecondaryNameNode、DataNode這幾個角色。

NameNode：是Master節點，是大領導。管理數據塊映射；處理客戶端的讀寫請求；配置副本策略；管理HDFS的名稱空間；

SecondaryNameNode：是一個小弟，分擔大哥Namenode的工作量；是NameNode的冷備份；合併fsimage和fsedits然後再發給namenode。

DataNode：Slave節點，負責存儲client發來的數據塊block；執行數據塊的讀寫操作。

熱備份：b是a的熱備份，如果a壞掉。那麼b馬上運行代替a的工作。

冷備份：b是a的冷備份，如果a壞掉。那麼b不能馬上代替a工作。但是b上存儲a的一些信息，減少a壞掉之後的損失。

FsImage：元數據鏡像文件（文件系統的目錄樹。）

EditLog：元數據的操作日誌（針對文件系統做的修改操作記錄）

NameNode內存中存儲的是=FsImage+EditLog。
SecondaryNameNode負責定時（默認1小時）從NameNode上，獲取FsImage和EditLog來進行合併，然後再發送給namenode。能有效解決Editlog逐漸變大帶來的問題。另外，可作爲名稱節點的“檢查點”，週期性地備份名稱節點中的元數據信息，當名稱節點發生故障時，就可以用第二名稱節點中記錄的元數據信息來進行系統恢復。

工作原理

寫操作：

有一個文件FileA，100M大小。Client將FileA寫入到HDFS中。
HDFS分佈在三個機架上Rack1，Rack2，Rack3。

Client將FileA按64M分塊。分成兩塊，block1和Block2。
Client向NameNode發送寫數據請求，如圖藍色虛線①。
NameNode節點，記錄block信息。並返回可用的DataNode，如粉色虛線②。
原理：
- NameNode具有RackAware機架感知功能，這個可以配置。
- 若client爲DataNode節點，那存儲block時，規則爲：副本1，同client的節點上；副本2，不同機架節點上；副本3，同第二個副本機架的另一個節點上；其他副本隨機挑選。
- 若client不爲DataNode節點，那存儲block時，規則爲：副本1，隨機選擇一個節點上；副本2，不同副本1，機架上；副本3，同副本2相同的另一個節點上；其他副本隨機挑選。
Client向DataNode發送block1；發送過程是以流式寫入。

流式寫入過程：

將64M的block1按64k的package劃分;
然後將第一個package發送給host2;
host2接收完後，將第一個package發送給host1，同時client想host2發送第二個package；
host1接收完第一個package後，發送給host3，同時接收host2發來的第二個package。
以此類推，如圖紅線實線所示，直到將block1發送完畢。
host2,host1,host3向NameNode，host2向Client發送通知，說“消息發送完了”。如圖粉紅顏色實線所示。
client收到host2發來的消息後，向namenode發送消息，說我寫完了。這樣就真完成了。如圖黃色粗實線
發送完block1後，再向host7，host8，host4發送block2，如圖藍色實線所示。
發送完block2後，host7,host8,host4向NameNode，host7向Client發送通知，如圖淺綠色實線所示。
client向NameNode發送消息,確認發送完畢。

分析寫過程，我們可以瞭解到：
①寫1T文件，我們需要3T的存儲，3T的網絡流量貸款。
②在執行讀或寫的過程中，NameNode和DataNode通過HeartBeat進行保存通信，確定DataNode活着。如果發現DataNode死掉了，就將死掉的DataNode上的數據，放到其他節點去。讀取時，要讀其他節點去。
③掛掉一個節點，沒關係，還有其他節點可以備份；甚至，掛掉某一個機架，也沒關係；其他機架上，也有備份。

讀操作：

讀操作流程爲：

a. client向NameNode發送讀請求。

b. NameNode查看Metadata信息，返回fileA的block的位置。

c. block的位置是有先後順序的，先讀block1，再讀block2。而且block1去host2上讀取；然後block2，去host7上讀取；

上面例子中，client位於機架外，那麼如果client位於機架內某個DataNode上，例如,client是host6。那麼讀取的時候，遵循的規律是：優選讀取本機架上的數據。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

這款Ubuntu的默認壁紙水母是真漂亮啊

2024-05-29 13:17:12

10. 有依賴的揹包問題

https://www.acwing.com/problem/content/10/ // 10. 有依賴的揹包問題.cpp : 此文件包含 "main" 函數。程序執行將在此處開始並結束。 // #include <iostream>

2024-05-29 13:15:32

12. 揹包問題求具體方案

https://www.acwing.com/problem/content/12/ // 12. 揹包問題求具體方案.cpp : 此文件包含 "main" 函數。程序執行將在此處開始並結束。 // #include <iostream>

2024-05-29 13:15:32

智能指針一些實現分析

智能指針一些實現分析提供值傳遞但是指針語義的功能。通過指針佔用並且對管理對象，在離開作用域時釋放該對象。在使用上還有另外一個很好用的功能，精簡了代碼複雜度，管理的對象類可以省略以下的函數默認構造函數複製構造函數複製賦值函數比

2024-05-29 13:15:22

智影AI故事轉視頻創作神器！快速開啓AI繪畫小說推文之旅

1.前言 1.1 生成內容形式生成內容形式主要包含三種，PGC（Professionally Generated Content）、UGC（User Generated Content）、AIGC（Artificially Int

2024-05-29 13:11:31

人人都是產品經理，尼恩產品經理面試寶典（史上最全、定期更新）

文章很長，且持續更新，建議收藏起來，慢慢讀！瘋狂創客圈總目錄博客園版爲您奉上珍貴的學習資源：免費贈送 :《尼恩Java面試寶典》持續更新+ 史上最全 + 面試必備 2000頁+ 面試必備 + 大廠必備 +漲薪必備免費贈送 :《尼

瘋狂創客圈

2024-05-29 13:10:50

逆向WeChat(四)

本篇在博客園地址https://www.cnblogs.com/bbqzsl/p/18209439 mars 先回顧一下，在上兩篇《WeUIEngine》，《EventCenter》。我對wechat如何使用chrome::base框架的分

2024-05-29 13:05:40

今日高三畢業喊樓助威

生活裏面的儀式感其實只有參與了纔有感覺，否則就是乾巴巴的儀式。持續接受壓力的環境下，通過集中的、集體的、無預謀近乎隨機的吶喊、嘶吼、書本等形式進行壓力釋放，是一個值得表揚的釋壓方式。

2024-05-29 13:05:00

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺

大型語言模型(llm)是在巨大的文本語料庫上訓練的，在那裏他們獲得了大量的事實知識。這些知識嵌入到它們的參數中，然後可以在需要時使用。這些模型的知識在培訓結束時被“具體化”。在預訓練結束時，模型實際上停止學習。對模型進行對齊或進行指令調優

2024-05-29 13:04:50

Git回滾本地已提交未推送的代碼

時常提交代碼時會多提交文件，推送的時候才發現多提交了文件。想回滾提交併且保留提交的修改執行以下命令: git reset --soft HEAD^

2024-05-29 13:01:49

日期選擇器：年月日動態切換顯示

1. 組件樣式部分（elementUI）實現 <el-row> <el-col :span="10"> <el-button-group> <el-button :

2024-05-29 13:00:29

數據展示動態（跑分）顯示

1.頁面顯示（強烈推薦） <template #header> <avue-data-tabs :option="dataOptions" :data="tabData" style="width: 75%;

2024-05-29 13:00:29

關於crmeb商城項目，未登錄狀態無法顯示秒殺界面內容問題

關於crmeb商城項目，未登錄狀態無法顯示秒殺界面內容問題 1.分析接口發現接口沒有權限驗證 2.分享後端發現後端代碼沒有權限驗證 3.分享當前頁面，發現沒有權限驗證原因是因爲api/activity.js，請求data後面要加上noAu

2024-05-29 12:59:49

一文教你如何調用Ascend C算子

本文分享自華爲雲社區《一文教你如何調用Ascend C算子》，作者：昇騰CANN。 Ascend C是CANN針對算子開發場景推出的編程語言，原生支持C和C++標準規範，兼具開發效率和運行性能。基於Ascend C編寫的算子程序，通過編譯

華爲雲開發者社區

2024-05-29 12:58:29

自定義一個簡單的日曆

前言此博客提供一個個人實現的自定義View，日曆的內容全部是通過繪製實現的。雖然是使用flutter實現自定義日曆View的，並且日曆可能很簡單，不是一個封裝完整的日曆。但是關鍵核心思想是一致的，可以提供給你自行實現自定義日曆的

2024-05-29 12:58:18

24小時熱門文章

最新文章

最新評論文章