【機器學習】SVM核函數的計算

原創

2020-07-06 12:39

在【機器學習】推導支持向量機SVM二分類中，我們已經推導出線性核SVM的對偶優化問題：

J = \sum i α i - 1 2 \sum i \sum j α i α j d i d j k (x i) T k (x j) = \sum i α i - 1 2 \sum i \sum j α i α j d i d j K (x i, x j) s u b j e c t t o \sum α i d i = 0, 0 \leq α i \leq C

在優化好

αi 拉格朗日量後，我們得到的w和b爲：

w = \sum α i d i x i b = - (y 1 + y - 1) / 2

需要注意的是，

w 的表達式中有

xi 。
　　我們引入核函數

K(xi,xj) 到SVM，必須注意到

K(xi,xj)=ϕ(xi)Tϕ(xj) ，也就是說理論上核函數應該能拆開。在引入核函數的前提下，w的表達式爲

w = \sum α i d i ϕ (x i) T

　　我們已知幾個常用核函數，比如多項式核函數和徑向基核函數。多項式核函數的的定義爲

K (x i, x j) = (x T i x j + 1) n

假設n=2，那麼拆開爲

K (x i, x j) = (x T i) 2 x 2 j + 2 x i x j + 1 = [(x T i) 2, 2 ‾ ‾ \sqrt x T i, 1] [(x T j) 2, 2 ‾ ‾ \sqrt x T j, 1] T

這裏，我們可以確實求出w的值。
　　徑向基核函數定義爲

K (x i, x j) = e - ( x i - x j ) 2 σ 2 = e - x 2 i σ 2 e - x 2 j σ 2 e x T i x j σ 2 = e - x 2 i σ 2 e - x 2 j σ 2 \sum k = 0 \infty ( 2 x T i x j / σ 2 ) k k ! = [e - x 2 i σ 2, 1, 2 1 ‾ ‾ \sqrt x i σ, 2 2 2 ! ‾ ‾ ‾ \sqrt (x i σ) 2, . . .] [e - x 2 j σ 2, 1, 2 1 ‾ ‾ \sqrt x j σ, 2 2 2 ! ‾ ‾ ‾ \sqrt (x j σ) 2, . . .] T

結果表明，

Φ(x) 函數是一個無限維度的函數。這說明，在工程上我們不一定能夠完美地拆開核函數爲

K(xi,xj)=ϕ(xi)Tϕ(xj) 。之後還有很多各種類型的核函數，比如使用了tanh函數的核函數，這些核函數在工程上是很難拆分求解的，很難獲取

ϕ(x) 函數，亦難以求取w的確切值。
　　那麼如何求解引入複雜核函數的SVM呢？在優化求解J之後，我們可以獲取並保存

αi 。由於SVM只有少量支持向量（數據）對決策超平面有決定作用，很多拉格朗日參數

αi→0 ，我們可以只保存足夠大的

αi 以及對應的訓練數據

xi 、標記

di ，不直接計算出w的確切值，這在工程上是確實可行的。
　　當我們需要進行預測的時候，我們導入

αi ,

xi 和

di ，然後把新數據x代入核函數，計算

y=∑iαidiK(xi,x)+b 即可。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.