深度理解HDFS架構

                                        深入理解HDFS架構

副本存放:

優化的副本存放策略是HDFS區分其他分佈式系統的重要特性。HDFS採用機架感知策略
來改進副本數據的可靠性,可用性,網絡帶寬的利用率。
通過機架感知,Namenode可以確定DataNode所屬機架id。
HDFS的存放策略是將一個副本存放在本地機架的節點上,一個副本放在同一機架的另一個節點,
最後一個副本存放在不同機架的節點上。
減少機架間的數據傳輸,提高了寫操作的效率,讀的時候更好利用多個機架的帶寬。

安全模式

Namenode啓動後會進入安全模式的特殊狀態,不進行數據塊的複製。
Namenode從所有的DataNode接收心跳信號和塊狀態報告。
塊狀態報告包括DataNode所有數據塊列表。檢測各數據塊是否達到最小副本數目。

文件系統元數據持久化

對於任何對文件系統元數據產生修改的操作,Namenode使用EditLog的事務日誌記錄下來。
整個文件系統的DataNode空間,包括數據塊到文件的映射,文件的屬性等,存儲在FsaImage文件。
當NameNode啓動時,從硬盤中讀取EditLog和FsImage,將所有的EditLog事務作用在內存中的Image。
保存FsImage,刪除EditLog,這個過程稱爲一個檢查點,只發生在NameNode啓動時。

文件系統回收站

如果啓用了回收站配置,用戶或應用程序刪除某個文件時,將這個文件重命名轉移到/trash目錄,以便後面的
復原。保存時間可以配置,超過時間,文件將被永遠刪除。

hadoop fs -rm /file
將file移動到回收站目錄。
hadoop fs -rm -skipTrash /file 
將file直接刪除。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章