1,使用spark讀取hive或者使用hive 命令行查詢表,發現列名被默認變成了TableName_FileName
解決辦法:
如果通過hive-clinet命令行查詢,只想對當前會話生效,執行如下命令即可:
> set hive.resultset.use.unique.column.names=false;
通過 set hive.cli.print.header = true;讓查詢結果顯示錶頭即可進行驗證。
> set hive.cli.print.header = true;
> select * from tableName limit 10;
如果想讓配置對多有查詢都生效,需要在hive配置文件hive-site.xml中添加配置,重啓hive即可
<property>
<name>hive.resultset.use.unique.column.names</name>
<value>false</value>
</property>
2,HDP3.0 集成了hive 3.0和 spark 2.3,然而spark卻讀取不了hive表的數據數據,準確來說是內表的數據。
原因
hive 3.0之後默認開啓ACID功能,而且新建的表默認是ACID表。而spark3.0及以前版本還不支持hive的ACID功能,因此無法讀取ACID表的數據.
Issues地址:https://issues.apache.org/jira/browse/SPARK-15348
解決辦法:
修改以下參數讓新建的表默認不是acid表:
hive.strict.managed.tables=false
hive.create.as.insert.only=false
metastore.create.as.acid=false