分類問題

分類問題

原創

2018-08-25 08:55

分類問題是監督學習中的一個問題。

當輸出變量Y取有限個離散值時，預測問題就成爲分類問題。此時X可以是離散的也可以是連續的。

分類器是從數據中學習到的一個分類模型或者分類決策函數。可能的輸出稱爲類。

分類問題的兩個過程：學習和分類。

分類器的性能指標，準確率：分類器正確分類的樣本數比上總樣本數。

二分類問題的評價指標：
精確率：(正類預測爲正類)/(正類預測爲正類+負類預測爲正類)

召回率：(正類預測爲正類)/(正類預測爲正類+正類預測爲負類)

分類的應用：

1在銀行領域構建客戶分類模型，對客戶按照貸款風險的大小進行分類。

2利用日誌數據的分類對非法入侵進行檢測。

3圖像領域，利用分類檢測圖像中是否有人臉出現。

4手寫識別，分類識別手寫的數字。

5搜索領域，分類用於網頁的抓取，排序和索引。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.