hive零散

cloudera自帶的spark可用後,安裝hive嘗試跑shark。

hive是將SQL轉換成MR作業運行的工具。

hive的三種模式:

內嵌模式:將元數據保存在本地內嵌的Derby數據庫中,這得使用Hive最簡單的方式,不過使用內嵌模式的話,缺點也比較明顯,因爲一個內嵌的Derby數據庫每次只能訪問一個數據文件,這也就意味着不支持多會話連接。這種情況應對本地測試可能都有所不足,僅供初學者熟悉應用Hive;

   

本地模式:這種模式是將元數據庫保存在本地的獨立數據庫中(比如說MySQL),這樣就能夠支持多會話多用戶連接。

   

遠程模式:如果我們的Hive客戶端比較多,在每個客戶端都安裝MySQL服務還是會造成一定的冗餘浪費,這種情況下,就可以更進一步,將MySQL也獨立出來,將元數據保存在遠端獨立的MySQL服務中。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章