分佈式文件系統HDFS

  • HDFS
    HDFS官網http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html
  • HDFS架構(HBase和YARN都是這種架構)
    1個Master帶N個Slaves,Master就是NameNode(NN),Slaves就是DataNode(DN)
    1個文件會被拆分成多個Block
    blocksize:128M
    130M=>2個block,一個128M,一個2M
  • NN:
    1)負責客戶端請求的響應
    2)負責元數據(文件的名稱和副本系數,Block存放的DN)的管理
  • DN:
    1)存放數據塊
    2)負責向DN發送心跳信息,彙報本身及其所有的block信息,健康狀況
    典型的架構是一臺機器運行一個NameNode,集羣裏面的其他機器都會運行一個DataNodes
    建議:NN和DN部署在不同的節點上

- 架構圖

HDFS架構圖

  • HDFS特性:
  • 支持傳統的層級文件創建及存儲
  • 對於文件的任何操作都會被NameNode記錄下來
  • 應用程序能夠指定副本的係數是多少
  • 任意時間內都只能有一次寫操作
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章