Hive總結——還沒總結完

1、什麼是Hive

Hive 由 Facebook 實現並開源
是基於 Hadoop 的一個數據倉庫工具
可以將結構化的數據 映射爲一張數據庫表,
並提供 HQL(Hive SQL)查詢功能,
底層數據是存儲在 HDFS 上。
Hive 的本質是將 SQL 語句轉換爲 MapReduce 任務運行,
使不熟悉 MapReduce 的用戶很方便地利 用 HQL 處理和計算 HDFS 上的結構化的數據,適用於離線的批量數據計算。

爲什麼說是“基於 Hadoop 的工具”:HDFS爲Hive提供數據存儲,MapReduce爲Hive提供了計算引擎,YARN爲Hive提供資源調度

數據倉庫:數據倉庫是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用於支持管理決策。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章