硬間隔
優化目標
能將所有樣本點正確分類的幾何間距最大的超平面。
w,bargmaxγs.t.yi(∣∣w∣∣wTxi+∣∣w∣∣b)≥γ,∀i
↓γ=∣∣w∣∣γ^ 函數間隔代替幾何間隔
w,bargmax∣∣w∣∣γ^s.t.yi(wTxi+b)≥γ^,∀i
↓γ^ 歸一化爲1
w,bargmax∣∣w∣∣1s.t.yi(wTxi+b)≥1,∀i
↓ 轉化爲凸優化問題
w,bargmin21∣∣w∣∣2s.t.1−yi(wTxi+b)≤0,∀i
KKT 條件
SVM優化目標的拉格朗日函數:
KKT條件給出了一組向量 w∗,b∗,λ∗ 是原問題最優解的必要條件(上述原問題是凸優化問題,所以是充要條件):
- ∇L∣w=w∗,b=b∗=0
- 1−yi(wTxi+b)≤0,∀i
- λi∗≥0,∀i
- λi∗(1−yi(w∗Txi+b∗))=0,∀i
但是這個優化問題仍然不好解
對偶問題
強對偶條件
凸優化問題+Slater條件
對應:SVM中數據線性可分
構造對偶問題
將原優化問題與約束條件寫成一個大的優化函數
將原優化問題轉化爲minmax問題
根據強對偶性質轉化爲maxmin問題
對偶問題求解
先求內層的min,對w,b求導=0,得到:
代入原函數,優化目標變爲:
使用SMO求解
凸優化問題
-
滿足爲凸優化問題?
一般地,如果一個同時擁有等式約束和不等式約束的最值問題
滿足條件:1. f(x) 是凸函數 2. gi(x) 都是凸函數 3. hi(x)都是仿射函數,即形如 形式的函數.那麼稱這是一個凸優化問題.
-
凸優化問題有優點:
局部最優解一定是全局最優解.
方法較多,容易求解.
使得KKT條件成爲充要條件.
再加上一個條件可以推出強對偶性.
參考鏈接:主脈絡