HBase與Hive的對比

1.Hive
(1) 數據倉庫
Hive 的本質其實就相當於將 HDFS 中已經存儲的文件在 Mysql 中做了一個雙射關係,以方便使用 HQL 去管理查詢。
(2) 用於數據分析、清洗
Hive 適用於離線的數據分析和清洗,延遲較高。
(3) 基於 HDFS、MapReduce
Hive 存儲的數據依舊在 DataNode 上,編寫的 HQL 語句終將是轉換爲 MapReduce 代碼執行。
2.HBase
(1) 數據庫
是一種面向列族存儲的非關係型數據庫。
(2) 用於存儲結構化和非結構化的數據
適用於單表非關係型數據的存儲,不適合做關聯查詢,類似JOIN 等操作。
(3) 基於 HDFS
數據持久化存儲的體現形式是 HFile,存放於 DataNode 中,被 ResionServer 以 region 的形式進行管理。
(4) 延遲較低,接入在線業務使用
面對大量的企業數據,HBase 可以直線單表大量數據的存儲,同時提供了高效的數據訪問速度。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章