AUC和線上點擊率指標不一致

原創

维尼弹着肖邦的夜曲

2020-03-23 18:49

問題：

深度模型相比LR模型，離線auc高於基線，線上ctr也高於，但是線上深度模型AUC低於基線。
一般，線上樣本存在bias，新模型去測試基線流量和實驗流量，實驗流量auc會高。

分析：

1 可能是auc失真，不同用戶排序結果不可比
使用gauc衡量

2 用戶auc分佈
實驗曝光未點擊較多
分析2 去掉只曝光行爲用戶
結論：auc在高分段實驗更有優勢
3 瀏覽長度和雙用戶樣本分佈差異

結論

1 深度模型分佈更均勻，召回差異小，auc不可比，gauc只能參考。
2 模型分佈發生變化，深度模型召回後排序難度更高。線上AB實驗樣本不一致，auc無可比性。
3 新模型展示商品質量上升，用戶點擊數有限，導致分數高的樣本加入負樣本，auc降低。

參考：

https://zhuanlan.zhihu.com/p/42521586

作者：eerfgaofree
鏈接：https://www.jianshu.com/p/1fa628916394
來源：簡書
著作權歸作者所有。商業轉載請聯繫作者獲得授權，非商業轉載請註明出處。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

使用scikit-learn計算分類器的ROC曲線及AUC值

在前面的博客中介紹了使用scikit-learn繪製分類器的學習曲線，今天介紹一下使用scikit-learn繪製分類器的ROC曲線，以及計算AUC的值。 ROC曲線主要用於衡量二分類器的性能，當正負樣本不均衡時，準確率和召回率不能合理度

2020-07-02 02:32:34

簡單易懂的ROC曲線和AUC面積

簡單易懂的ROC曲線和AUC面積前言咱們在前面的學習中，對於模型的好壞，我們使用最多的是用精準度來衡量。這對於數據樣本類別個數相對均勻來講，是很好的衡量方法。但是對於數據樣本類別極度失衡的情況，比如正樣本有1000個，負樣本只

梁先森-python数据分析师进阶之路

2020-06-21 10:09:38

AUC，ROC理解

本來對AUC和ROC的理解有點模糊，網上看了以下下兩篇博文，感覺更清楚了。 https://blog.csdn.net/u013385925/article/details/80385873 https://blog.csdn.net/q

会飞的犬良

2020-06-20 21:01:20

【機器學習】ROC曲線和AUC面積

ROC曲線的橫座標軸是FPR（False Positive Rate），縱座標軸是TPR（True Positive Rate），對應於下面的混淆矩陣（fusion matrix）： TPR=TPTP+FNTPR = \frac{

敲代码的quant

2020-06-14 01:56:27

性能度量 | 分類模型的評估指標

2020-05-17 19:14:41

機器學習常用評價指標、混淆矩陣、ROC曲線、AUC

星落秋风五丈原

2020-05-10 21:00:55

計算機視覺面試考點（11）常用評價指標(準確率、精確率、召回率、漏警率、虛警率、F1、P-R、ROC、AUC)

嘻嘻哈哈yjy

2020-04-23 20:27:49

有監督機器學習模型的評估指標

2020-02-23 03:23:31

ROC曲線與AUC計算

2020-02-21 10:53:28

理解AUC和ROC曲線

2019-03-29 13:13:30

auc-終於理解它

模型評價指標有幾種，面試應該是必考了：準確率、召回率、精準率、F1score、auc。先引入混淆矩陣，縱軸是預測情況，陰/陽，橫軸是真實標籤，陰/陽預測/真實標籤陰陽陰 TN（真陰）：本來陰，預測陰 FN（假陰）：本來陽，預測陰

沙扬娜拉的裙裾

2020-07-03 06:23:06

使用scikit-learn計算分類器的ROC曲線及AUC值

在前面的博客中介紹了使用scikit-learn繪製分類器的學習曲線，今天介紹一下使用scikit-learn繪製分類器的ROC曲線，以及計算AUC的值。 ROC曲線主要用於衡量二分類器的性能，當正負樣本不均衡時，準確率和召回率不能合理度

2020-07-02 02:32:34

auc是怎麼計算的？

1 roc曲線計算auc 我們都知道auc是roc曲線下的面積，但這種計算不方便 2 公式計算auc 有另外一種計算方法：任意給一個正類樣本和一個負類樣本，正類樣本的score大於負類樣本的score的概率公式如下 M 是正樣

飞奔的帅帅

2020-06-29 23:11:09

通過三個直觀步驟理解ROC曲線

ROC曲線是一個分類模型效果好壞評判的的可視化表示。在這篇文章中，我將分三個步驟頭開始構建ROC曲線。步驟1:獲取分類模型預測當我們訓練一個分類模型時，我們得到得到一個結果的概率。在這種情況下，我們的例子將是償還貸款的可能性

2020-06-29 07:08:25

簡單易懂的ROC曲線和AUC面積

簡單易懂的ROC曲線和AUC面積前言咱們在前面的學習中，對於模型的好壞，我們使用最多的是用精準度來衡量。這對於數據樣本類別個數相對均勻來講，是很好的衡量方法。但是對於數據樣本類別極度失衡的情況，比如正樣本有1000個，負樣本只

梁先森-python数据分析师进阶之路

2020-06-21 10:09:38

24小時熱門文章

最新文章

最新評論文章