分類問題
在分類問題中,你要預測的變量 是離散值
分類問題的例子有:判斷一封電子郵件是否是垃圾郵件;判斷一次金融交易是否是欺詐;之前我們也談到了腫瘤分類問題的例子,區別一個腫瘤是惡性的還是良性的
從二分類開始
可能屬於的兩個類分別稱爲負向類(negative class)和正向類(positive class),則因變量 ,其中 0 表示負向類,1 表示正向類
如果將threshold設爲0.5,則假設函數>0.5時,將樣本判斷爲1
二分類問題的問題
對於分類問題, 取值爲 0 或者1,但如果使用的是線性迴歸,那麼假設函數的輸出值可能遠大於 1,或者遠小於0,但是我們希望分類器的輸出值在0和1之間
S型函數/邏輯函數,該模型的輸出變量範圍始終在0和1之間
S型函數/邏輯函數的圖像是
在S型函數下,邏輯迴歸模型的假設函數
此時的作用是對於給定的輸入變量,根據選擇的參數計算輸出變量==1的可能性,即。如果對於給定的,通過已經確定的參數計算得出,則表示有70%的機率爲正向類