一個問題困擾了2天時間,sql看着沒問題,數據就是對不上,記錄問題原因如下。
當使用hive或其他搜索引擎進行join操作時,要確保on的條件左右兩邊的類型一致,否則會出現很多莫名其妙的問題或結果。
比如:
t1表
字段 | 類型 |
---|---|
id | bigint |
name | string |
t2表
字段 | 類型 |
---|---|
voucher_id | string |
age | int |
在full join的過程中,採用t1.id=t2.voucher_id可能導致出現意外的結果數據。
使用cast轉化下類型,再進行on操作,則會解決。