推薦系統常用評估指標對比

原創

wxc575843_bill

2020-07-03 11:44

制定評估指標是數據挖掘前期很重要的一步，一個好的評估指標要和關心的業務指標波動一致。這樣可以通過對比不同模型的評估指標，來評價模型在實際業務中的效果，加快模型迭代週期，降低線上成本。

在推薦系統中評估指標可以分爲三類：分類指標，迴歸指標，排序指標。

分類問題

分類問題輸出是物品的類別，對於二分類問題，輸出爲0/1單個值；對於多分類問題，輸出爲一個one-hot向量 $\textbf{y}=[0, 0, 1]^T$ ，其中只有一個值爲1，爲1的列代表了模型預測樣本的分類。

精確率和召回率

談到精確率和召回率就設計到混淆矩陣，爲了方便解釋，以下未做說明的地方均爲二分類任務。

混淆矩陣中TP和TN很清楚，但是FP和FN經常記錯，暫時沒有什麼好辦法。

精確率的定義如下：
$P=\frac{TP}{TP+FP}$
精確率表示，預測爲正的數據中，有多少個真的是對的。

召回率的定義如下：
$R=\frac{TP}{TP+FN}$
召回率表示，所有正的數據中，有多少個被預測出來了。

可以在藉助下圖理解，左邊的圓圈代表預測爲正的樣本集合，右邊的圓圈代表真實爲正的樣本集合。精確率爲黃色部分除以左邊圓的面積，召回率是黃色部分除以右邊圓的面積。

理想情況下，精確率和召回率都越高越好。事實上這個很難達到，當精確率提升時，召回率就會下降。反之，召回率提升時，精確率就會下降。一個極端的例子，如果我們把所有例子都預測爲正，那麼召回率爲1，見下圖左邊的情況。反之，如果只把非常肯定的預測爲正，那麼精確率就爲1，見下圖右邊的情況。

爲了同時評估精確率和召回率，可以使用 $F_1$ score，它是精確率和召回率的調和平均值，公式如下：
$\frac{2}{F_1}=\frac{1}{P}+\frac{1}{R}$

未完待續。。。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

推薦系統常用評估指標對比

分類問題

精確率和召回率

.Net 8.0 下的新RPC，IceRPC之試試的新玩法"打洞"

關於遊戲付費的一點想法

我通過CKA和CKS啦！

《最新出爐》系列入門篇-Python+Playwright自動化測試-42-強大的可視化追蹤利器Trace Viewer

大數據怎麼學？對大數據開發領域及崗位的詳細解讀，完整理解大數據開發領域技術體系

推薦系統常用評估指標對比

ML學習筆記(一)：naive bayas

《機器學習》學習筆記二

數據庫大作業總結 android+Java web+mysql

《機器學習》學習筆記一

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結