之前的博文中,我們討論了線性支持向量機。這裏,我們討論非線性的情況。
(1)樣本集線性不可分,是說對於樣本集,其中,不等式不可能被所有樣本同時滿足。
(2)當(1)中的問題存在時,即稱爲非線性可分。我們總可以在不等式的左側加上一個正數(我們稱該數爲鬆弛因子),使得不等式成立。如果樣本被正確分類,即,則;如果樣本不能被正確分類,則這個樣本對應的,則。
(3)我們在(2)的條件下重新設計支持向量機:
①所有樣本的鬆弛因子之和,可以反映整個訓練樣本集的錯分程度:錯分樣本越多,越大;樣本錯分程度越大,也越大。顯然,我們希望儘可能小。因此,我們在線性可分情況下的目標函數上增加對錯誤的懲罰。
②新的目標函數反映了我們的兩個目的:一方面希望分類間隔儘可能大,另一方面希望錯分的樣本儘可能少且錯誤程度儘可能低。
③c是一個需要選擇的參數。c越小,表示對錯誤較容忍而強調對於正確分類的樣本的分類間隔;c越大,表示對分類錯誤的懲罰越大。
(4)將原始問題轉化爲對偶問題,則有
這裏,
①對偶問題同樣是拉格朗日函數的極大極小問題,首先求對的極小:
可以得到:
②將(4)—①中的解代入中,可以得到:
③再對求關於α的極大值,則有對偶問題:
④在分類時,分類正確但處於分類邊界面上的樣本,有。這些樣本點就是離分類超平面最近的那些樣本(支持 向量點),並決定最優超平面的位置。由以上敘述可求得解:
上式求解的過程中,是任意一個的樣本點。
⑤原始問題構造的分離超平面可以寫作:
分類決策函數就可以寫作:
(5)關於非線性支持向量機的鬆弛因子問題討論: 一般來說,線性不可分問題在加入鬆弛變量後可以實現線性可分。其支持向量可能是在間隔邊界上,可能是在間隔邊界與分離超平面中間,或者在分離超平面誤分一側。
若,則,此時支持向量恰好落在分類正確的間隔邊界上及邊界內;
若,則,此時支持向量恰好落在分類正確的間隔邊界與分離超平面之間;
若,則,此時支持向量恰好落在分離超平面上;
若,則,此時支持向量恰好落在分離超平面誤分一側。