業務場景:
做數據分析的時候,經常會用到hive -e "sql" > result.csv,然後將結果導入到excel中,可是使用hive -e
導出後默認的分隔符是\t
,excel無法識別,所以需要將\t
轉成,
方案一:使用linux管道符替換
hive -e "select * from table limit 10" | sed 's/\t/,/g' > result.csv
或者
hive -e "select * from table limit 10" | tr "\t" "," > result.csv
方案二:使用hive的insert語法導出文件
insert overwrite local directory '/home/hadoop/20200521'
row format delimited
fields terminated by ','
select * from table limit 10;