Hive 1.1.0分区表新增字段后,数据为空的解决办法

如果使用alter table add column语句对分区表增加字段时没有使用cascade关键字,会导致Hive只维护了表的元数据,而没有分区的元数据。

现象就是,重新insert overwrite了历史有数据的分区,但是select 新增字段仍然没有数据。

起初,我以为是BUG,但是查看了官方文档发现并不是BUG。

官方文档描述如下:

The CASCADE|RESTRICT clause is available in Hive 1.1.0. ALTER TABLE ADD|REPLACE COLUMNS with CASCADE command changes the columns of a table's metadata, and cascades the same change to all the partition metadata. RESTRICT is the default, limiting column changes only to table metadata.

如上所述,在1.1.0中表和分区的元数据就是分开处理的,在增加字段的时候添加CASCADE能同时更新表和分区 对于,在添加字段的时候没有指定的cascade的情况,

可以手动使用如下命令来对分区添加 alter table 表名 partition(dt='2019-04-26') add columns(字段名 类型);

然后重新查询就新增字段就会有数据了。

注意:对于执行了add column语句之后新生成的分区,是不会有问题的,Hive会自动维护新分区中的元数据。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章