@Author : Spinach | GHB
@Link : http://blog.csdn.net/bocai8058
HDFS優點
- 高容錯性:數據自動保存多個副本,副本丟失後,自動恢復;
- 適合批處理:移動計算而飛數據。數據位置暴露給計算框架;
- 適合大數據處理:GB,TB,設置PB級數據。百萬規模以上文件數量。10K+節點規模。
- 流式文件訪問:一次性寫入,多次讀取。保證數據一致性。
- 可構建在廉價機器上:通過多副本提高可靠性。提供容錯和恢復機制。
- 水平可伸縮:向集羣中添加節點
HDFS缺點
- 不適合低延遲數據訪問場景:比如毫秒級,低延遲與高吞吐率
- 不適合小文件存取場景:佔用NameNode大量內存。尋道時間超過讀取時間。
- 不適合併發寫入,文件隨機修改場景:一個文件只能有一個寫者。僅支持append
- 不支持超強的事務:沒有像關係型數據庫那樣,對事務有強有力的支持。