【大數據學習07】Hadoop中HDFS的讀寫流程

原創

1025yC

2020-06-10 15:10

一次寫入多次讀取：

即：一個寫入者。
缺陷：
1）不能修改，只能追加。（數據已經分塊存儲，不知道在哪個塊）
2）不建議存儲小文件（hdfs將大文件分塊，默認128M。小文件獨佔一塊。）

hdfs將大文件分塊，採用分塊存儲，使用本地校驗，保證數據無損壞。

數據存儲：

虛擬磁盤(1)------->(n)元化數據
元化數據(1)------->(1)本地化磁盤映像fsiamge

hdfs結構

client 訪問 NameNode ---->DataNodes
SecondaryNameNode是Name的冷備份（幫助合併映像文件和日誌信息，不能在NN宕機後自動替換使用，但可以幫助恢復）

HDFS是主從結構

namenode：master節點，管理數據塊映射，處理客戶端讀寫請求，配置副本策略，管理目錄樹（HDFS的名稱空間）
secondaryNameNode：分擔NN的工作量，合併fsimage和fsedits併發送給NN
dataNode：存儲數據，冗餘備份，讀寫操作
fsimage：元數據鏡像文件（文件系統的目錄樹）
fsedits：元數據的操作日誌
NameNode（內存存儲） = fsimage + fsedits
secondaryNameNode：負責默認定時一小時從namenode上獲取fsimage + fsedits來合併，再發送給namenode，減少NN工作量

hdfs寫流程

secondaryNameNode合併流程

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【大數據學習07】Hadoop中HDFS的讀寫流程

一次寫入多次讀取：

hdfs將大文件分塊，採用分塊存儲，使用本地校驗，保證數據無損壞。

數據存儲：

hdfs結構

HDFS是主從結構

hdfs寫流程

secondaryNameNode合併流程

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

【大數據學習01】安裝Linux虛擬機配置NAT 主機和虛擬機相互訪問

【大數據學習03】Hadoop中配置HDFS集羣

【大數據學習04】Hadoop中HDFS配置文件的作用

動態設置iframe高度 JavaScript

【大數據學習02】安裝Hadoop

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結