哲哲的ML筆記(十:分類問題與S型函數)

分類問題

在分類問題中,你要預測的變量y 是離散值
分類問題的例子有:判斷一封電子郵件是否是垃圾郵件;判斷一次金融交易是否是欺詐;之前我們也談到了腫瘤分類問題的例子,區別一個腫瘤是惡性的還是良性的

從二分類開始
可能屬於的兩個類分別稱爲負向類(negative class)和正向類(positive class),則因變量y \in{0, 1} ,其中 0 表示負向類,1 表示正向類


如果將threshold設爲0.5,則假設函數>0.5時,將樣本判斷爲1

二分類問題的問題

對於分類問題, y 取值爲 0 或者1,但如果使用的是線性迴歸,那麼假設函數的輸出值可能遠大於 1,或者遠小於0,但是我們希望分類器的輸出值在0和1之間

S型函數/邏輯函數,該模型的輸出變量範圍始終在0和1之間
g(z)=\frac{1}{1+e^{ -z}}
S型函數/邏輯函數的圖像是

在S型函數下,邏輯迴歸模型的假設函數
h_\theta(x)=g(\theta^Tx)=\frac{1}{1+e^{ -\theta^Tx}}
此時h_\theta(x)的作用是對於給定的輸入變量,根據選擇的參數計算輸出變量==1的可能性,即h_\theta(x)=P(y=1|x;\theta)。如果對於給定的x,通過已經確定的參數計算得出h_\theta(x)=0.7,則表示有70%的機率爲正向類

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章