hive3.0使用問題小記

1,使用spark讀取hive或者使用hive 命令行查詢表,發現列名被默認變成了TableName_FileName

解決辦法:

如果通過hive-clinet命令行查詢,只想對當前會話生效,執行如下命令即可:

> set hive.resultset.use.unique.column.names=false;

通過 set hive.cli.print.header = true;讓查詢結果顯示錶頭即可進行驗證。

> set hive.cli.print.header = true; 
> select * from tableName limit 10;

如果想讓配置對多有查詢都生效,需要在hive配置文件hive-site.xml中添加配置,重啓hive即可

<property> 
    <name>hive.resultset.use.unique.column.names</name>
    <value>false</value> 
</property>

 

2,HDP3.0 集成了hive 3.0和 spark 2.3,然而spark卻讀取不了hive表的數據數據,準確來說是內表的數據。

原因

hive 3.0之後默認開啓ACID功能,而且新建的表默認是ACID表。而spark3.0及以前版本還不支持hive的ACID功能,因此無法讀取ACID表的數據.

Issues地址:https://issues.apache.org/jira/browse/SPARK-15348

 

解決辦法:

修改以下參數讓新建的表默認不是acid表:

hive.strict.managed.tables=false 
hive.create.as.insert.only=false 
metastore.create.as.acid=false

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章