如何校驗SQL查詢結果是否準確

總結平常工作中幾種校驗數據的思路

1、對比其他渠道數據結果

如何校驗SQL查詢結果是否準確
查詢需求:從Hive端查詢20190909當天的訂單量(簡單例子),需要校驗SQL結果是否正確
校驗方法:Hive的上游數據源爲Mysql,Mysql端會有一些產出數據可供校驗
如上數據流程下,如果在展現訂單數據量的情況下,Hive執行查詢結果需要驗證,可以從Mysql渠道的數據結果進行對比來校驗。
舉的例子比較簡單,但是屬於校驗數據結果的一個思路和方法。

2、分量累加比較總量
表結構:
訂單ID 訂單日期 訂單渠道
1 20190808 A
2 20190808 A
3 20190808 B
4 20190808 B
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C

查詢需求:查詢每天,每個渠道的訂單量
校驗方法:可對每天,每個渠道的訂單量進行累加,看看是否與當天總訂單量相同

3、分步驗證結果(A left join B left join C的情況)
有訂單表,商品表,用戶表
查詢需求:查詢電子產品,用戶年齡小於18歲的訂單明細
校驗方法:遇到這類查詢場景,首先用訂單表 Join 商品表,確定符合電子產品的訂單明細以及數據量,這歸結爲第一步校驗;
在第一步校驗基礎上再關聯用戶表,篩選用戶年齡小於18歲的條件,進行第二部校驗。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章