1分類任務
監督學習
訓練:從訓練集上學習 每一個樣本X有一個對應的預測值y 學習的是從x到y的一個映射
分類:分類問題中 y是離散值 表示不同的類別
測試:輸入一個新的數據x 用學習到的映射f 輸出預測值
上圖爲一個分類任務的圖像 不用顏色的數據代表這不同的類別y 用的是線性分類器 是一條直線 在這條線上面 屬於兩個類別的 概率是相等的 這個也叫做決策邊界
2分類任務舉例
- 垃圾郵件過濾 手寫體數字識別(手寫鈔票) 語音識別 人臉識別 醫療識別(機器>醫生) 金融風控識別
3分類
- 貝努力實驗就是一個二分類任務 任務成功y=1 任務失敗y=0
- 概率密度函數 參數是μ 有 y=1的概率 和y=0 的概率
-分類任務中 是在輸入x的概率下 參數變成μ(x)
把期望μ(x)假設成最簡單的線性函數
這裏的 函數是一個取值是-∞到+∞的範圍 我們做的是二分類 要把他轉換到[0,1]之間
這裏我們用到了sigmoid 函數
4sigmoid函數
sigmoid 的輸入是實數範圍內的數 輸出是[0,1] 之間數 也可以理解爲是屬於0/1的概率的大小。
5Logistic迴歸模型
發生的概率 + 不發生概率 =1
6一個事件放生的機率(obs)
推導得出結論:
6決策函數和決策邊界
不同的預測函數對應的決策邊界 是不同的形狀的。
7判定類別:
假如以二分類爲例:判斷樣本是屬於類別a還是屬於類別b 這裏有兩個類別
就有對應的兩個判別函數 分別對應是屬於類別a的概率 和屬於類別b的概率
分類任務輸出樣本類別就是最大概率所對應的類別。
8決策邊界