hdfs

hdfs概念

類似於unix文件系統，hdfs也有block的概念，默認是128MB，但是和unix文件系統不同的是，1個1MB的文件，不會佔用一個block的全部大小，仍然只佔用1MB空間。

block的用途：

Namenode：

HDFS文件系統中的文件目錄樹，以及文件的數據塊索引，即每個文件對應的數據塊列表。目錄樹、元數據和數據塊的索引信息會持久化到物理存儲中，實現是保存在命名空間的鏡像fsimage和編輯日誌edits中。
數據塊和數據節點的對應關係，即某一塊數據塊保存在哪些數據節點的信息。存儲在內存中，由NameNode啓動後DataNode主動上報它所存儲的數據塊，動態建立對應關係。

Datanode：

secondary namenode：

hadoop2.x方案，兩個namenode，active-standby模式

共享存儲，保存edit log，當主namenode掛掉，備份namenode變爲active，從共享存儲中讀取edit log，構建namespace image，並讀入內存。共享內存選擇（NFS/QJM）
datanode將file-block-datanode映射關係同時發給上述兩個namenode
client必須能以用戶沒有感知的情況下，在主備namenode之間切換

參考：http://blog.csdn.net/anzhsoft/article/details/23279027

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.