# Logistic regression中的threshold

Logistic regression中的threshold

參考

[1] https://developers.google.com/machine-learning/crash-course/classification/thresholding

邏輯迴歸返回的是一個概率。您可以“原樣”使用返回的概率(例如:用戶點擊此廣告的概率爲0.00023),也可以將返回的概率轉換成二元值(例如,這封電子郵件是垃圾郵件)。

如果某個邏輯迴歸模型對某封電子郵件進行預測時返回的概率是0.9995,則表示該模型預測這封郵件非常可能是垃圾郵件。相反,在同一個邏輯迴歸模型中預測分數爲0.0003的另一封電子郵件很可能不是垃圾郵件。可是如果某封電子郵件的預測分數爲0.6呢?爲了將邏輯迴歸值映射到二元類別,您必須制定分類閾值classification threshold(也稱爲判定閾值decision threshold)

如果值高於該閾值,則表示垃圾郵件。如果值低於該閾值,則表示非垃圾郵件。人們往往會認爲分類閾值應該始終爲0.5, 但是閾值取決於具體問題,因此您必須對其進行調整。

我會在後面的部分中詳細介紹可用於對分類模型進行評估的指標,以及更改分類閾值對這些評估指標的影響。
注意:“調整”邏輯迴歸的閾值不同於調整學習率等超參數。在選擇閾值時,需要評估您將因犯錯而承擔多大的後果。例如,將非垃圾郵件誤標記爲垃圾郵件會非常糟糕。不過,雖然將垃圾郵件誤標記爲非垃圾郵件會令人不快,但是應該不會讓您丟掉工作。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章