來捋一捋SVM吧

硬間隔

優化目標

能將所有樣本點正確分類的幾何間距最大的超平面。

argmaxw,bγs.t.yi(wTwxi+bw)γ,i\mathop{argmax}\limits_{w,b} \gamma \quad s.t.\quad y_i(\frac{w^T}{||w||}x_i+\frac{b}{||w||})\geq\gamma ,\forall i

γ=γ^w\quad \quad \quad \downarrow \gamma= \frac{ \hat{\gamma}}{||w||} 函數間隔代替幾何間隔

argmaxw,bγ^ws.t.yi(wTxi+b)γ^,i\mathop{argmax}\limits_{w,b} \frac{ \hat{\gamma}}{||w||} \quad s.t.\quad y_i(w^Tx_i+b)\geq \hat{\gamma},\forall i

γ^\quad \quad \quad \downarrow \hat{\gamma} 歸一化爲1

argmaxw,b1ws.t.yi(wTxi+b)1,i\mathop{argmax}\limits_{w,b} \frac{1}{||w||} \quad s.t.\quad y_i(w^Tx_i+b)\geq 1,\forall i

\quad \quad \quad \downarrow 轉化爲凸優化問題

argminw,b12w2s.t.1yi(wTxi+b)0,i\mathop{argmin}\limits_{w,b} \frac{1}{2} ||w||^2 \quad s.t.\quad 1-y_i(w^Tx_i+b)\leq 0,\forall i

KKT 條件

SVM優化目標的拉格朗日函數:
在這裏插入圖片描述
KKT條件給出了一組向量 w,b,λw^*,b^*,\lambda^* 是原問題最優解的必要條件(上述原問題是凸優化問題,所以是充要條件):

  • Lw=w,b=b=0\nabla_{}L|_{w=w^*,b=b^*}=0
  • 1yi(wTxi+b)0,i1-y_i(w^Tx_i+b)\leq 0,\forall i
  • λi0,i\lambda_i^*\geq0 ,\forall i
  • λi(1yi(wTxi+b))=0,i\lambda_i^*(1-y_i(w^{*T}x_i+b^*))=0,\forall i

但是這個優化問題仍然不好解

對偶問題

強對偶條件

凸優化問題+Slater條件
在這裏插入圖片描述
對應:SVM中數據線性可分

構造對偶問題

將原優化問題與約束條件寫成一個大的優化函數

在這裏插入圖片描述
將原優化問題轉化爲minmax問題

在這裏插入圖片描述
根據強對偶性質轉化爲maxmin問題
在這裏插入圖片描述

對偶問題求解

在這裏插入圖片描述
在這裏插入圖片描述
先求內層的min,對w,b求導=0,得到:
在這裏插入圖片描述
代入原函數,優化目標變爲:
在這裏插入圖片描述
使用SMO求解

凸優化問題

  • 滿足爲凸優化問題?
    一般地,如果一個同時擁有等式約束和不等式約束的最值問題
    在這裏插入圖片描述
    滿足條件:1. f(x)f(x) 是凸函數 2. gi(x)g_i(x) 都是凸函數 3. hi(x)h_i(x)都是仿射函數,即形如 在這裏插入圖片描述 形式的函數.那麼稱這是一個凸優化問題.

  • 凸優化問題有優點:
    局部最優解一定是全局最優解.
    方法較多,容易求解.
    使得KKT條件成爲充要條件.
    再加上一個條件可以推出強對偶性.

參考鏈接:主脈絡

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章