hive內部表和外部表的區別

我們在使用數據倉庫時,一般會公司會使用hive作爲首選數據倉庫而不是性能更高Teradata(數據倉庫配備性能最高、最可靠的大規模並行處理 (MPP) 平臺,能夠高速處理海量數據,其性能遠遠高於Hive)呢,這就是hive的最大的優點一個是原生hadoop生態系統完全兼容第二個就是不要錢。關於數據倉庫是什麼我之前做過解釋,這裏就添加一個面試常問的問題,hive內部表和外部表有什麼區別?

其核心就一個:默認創建的內部表是存儲在hive數據倉庫的指定目錄下面的/user/hive/warehouse/test.db下面,而如果是外部表,那麼默認直接落地在HDFS下的/user目錄下
衍生出來的結果就是,內部表在刪除時會刪除元數據和表數據,而外部表不在hive目錄下,只刪除元數據

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章