HDFS存儲的優缺點

@Author  : Spinach | GHB
@Link    : http://blog.csdn.net/bocai8058

HDFS存儲的優缺點

HDFS優點

  • 高容錯性:數據自動保存多個副本,副本丟失後,自動恢復;
  • 適合批處理:移動計算而飛數據。數據位置暴露給計算框架;
  • 適合大數據處理:GB,TB,設置PB級數據。百萬規模以上文件數量。10K+節點規模。
  • 流式文件訪問:一次性寫入,多次讀取。保證數據一致性。
  • 可構建在廉價機器上:通過多副本提高可靠性。提供容錯和恢復機制。
  • 水平可伸縮:向集羣中添加節點

HDFS缺點

  • 不適合低延遲數據訪問場景:比如毫秒級,低延遲與高吞吐率
  • 不適合小文件存取場景:佔用NameNode大量內存。尋道時間超過讀取時間。
  • 不適合併發寫入,文件隨機修改場景:一個文件只能有一個寫者。僅支持append
  • 不支持超強的事務:沒有像關係型數據庫那樣,對事務有強有力的支持。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章