(LXTML筆記)關於支持向量機[二]

下面討論的是對偶支持向量機,先看引入
這裏寫圖片描述
由上一節我們知道,樸素支持向量機可以通過二次規劃來直接解決,但是我們假設x 本身是一個d 維的向量,然後由於可能有複雜邊界,所以我們常常要講x 轉換到Z 空間上,通過zn=ϕ(xn) 來實現,在實際中這裏的ϕ 往往是升維度的,因爲一般是不可線性可分,然後(比如)高維的時候就變成線性可分了,不妨比如如

ϕ(x)=(x12,x1x2,x1x3....xdx1,xdx2,...xd2),

這樣的話複雜度(如內積)完全取決於ϕ 的形式,這裏變成了至少O(d2) ,這給二次規劃帶來了巨大的壓力,那麼此時我們引入SVM的對偶問題

將SVM的複雜度變爲和數據的數量相聯繫

這裏寫圖片描述

和正則化那一節類似地,我們可以考慮如下拉格朗日函數,企圖將約束條件去掉,塞進最優化部分。
這裏寫圖片描述

最優化問題變爲了

minb,w(maxan0{L(b,w,a)}),

這個操作也是迫使向的,假設有一個(b,w) 不滿足限制條件,那麼就是說yn(wTzn+b)<1 ,所以容易知道(maxan0{L(b,w,a)})+ ,而假設全部的(b,w) 都滿足限制條件的話,那麼容易知道(maxan0{L(b,w,a)})=wTw ,這和我們原來的最優化目標是一樣的。

至此,我們去掉了限制條件,下面引入對偶問題,我們知道對於

minb,w(maxan0{L(b,w,a)}),

固定a 的話,我們輕鬆得到:
這裏寫圖片描述
由於對任何固定a 都成立,那麼我們對右邊的a 取最大仍是成立的,我們得到了minmaxmaxmin 的結論,如下圖
這裏寫圖片描述
如果上面的這個大於等於號是等號就好了,而最優化裏有這樣的一個結論:
這裏寫圖片描述
對於二次規劃問題,如果
  • 凸函數
  • 可分的
  • 限制條件是線性的

那麼稱上述對偶問題爲強對偶問題,存在一組(b,w,a) 使得兩邊都成立,即等號成立,即解左右兩邊都是一樣的。下面我們來看右邊的對偶問題能帶來什麼便利,

整理一下,現在問題變爲
這裏寫圖片描述
考慮取到最小值時候的費馬點條件,對wb 進行求導,然後將這些必要條件放在限制條件上有
這裏寫圖片描述
這樣下來,我們可以看到我們已經去掉了”min ”了,此時最優化目標僅僅與a 有關,總結一下既有
這裏寫圖片描述
上述中的4點展示的是KKT條件(不過略強,實際上可以稍微放鬆一點條件),第四點是上文中關於

minb,w(maxan0{L(b,w,a)}),

的描述所保證的。
這裏寫圖片描述

依舊採用二次規劃的問題的方法即可
這裏寫圖片描述
要還原回原來的(w,b) 的話,在求得所有的an 後,由我們最優條件的w=anynzn) 可以獲得w ,而由於有an(1yn(wTzn+b))=0 ,所以我們只需要找到一個非零的an 就可以得到我們要的b ,特別地我們可以觀察到,實際上,整個問題只和非零的an 有關係,之前上文中將在“胖邊界”上的點成爲“支持向量”,而此時我們可以更進一步地加強,稱這些對應an0 的點稱爲“支持向量”
這裏寫圖片描述
再次將樸素SVM和對偶SVM放在一起對比 有:
這裏寫圖片描述

這裏表面上在計算對偶SVM時候,隱藏了xn 的維度d ,但是實際上,這部分的計算蘊含在矩陣Q 中,計算這個Q 並不容易,下一節,將講到如何應用“核函數”技巧來化簡計算量,讓SVM能落實到應用中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章