支持向量機鬆弛變量的理解

1,線性可分,即能找到超平面,對於硬間隔支持向量機
2,部分點不可分,總體近似可分,近似線性可分,對應軟間隔支持向量機
3,線性不可分,需要用到核函數

軟間隔支持向量機要加個鬆弛變量ξ。
我們都知道,硬間隔滿足,yi * ( wi * x + b )≥1,這是函數間隔,是幾何間隔的||w|| 倍。
由於一些點出現在兩條線的間隔內部,函數間隔的約束條件不滿足,所以引入鬆弛變量ξ,使yi * ( wi * x + b ) + ξ ≥1,即:yi * ( wi * x + b ) ≥1 - ξ。對於這些離羣點有對應的鬆弛變量,其他的點是沒有鬆弛變量ξ的。

再來另外一個解釋:

1,函數距離與幾何距離

你需要明白兩個概念,函數距離(函數間隔)和幾何距離(幾何間隔),先看個圖:平行直線1與2之間的垂直距離d,就是幾何距離,也就是我們平常計算的兩條平行直線之間的距離。函數間隔,就是圖中的d帽(暫時這麼稱呼):

它是兩條平行直線在某一條軸線(例如x軸)上的距離。在二維平面,它是豎着的,如圖中的藍色線標註,也可以是橫着的,圖中未畫出。
函數距離和幾何距離之間有關係,在本例中爲:

||w||是矩陣w的模
在本例中,函數距離(d帽)就是直線1減去直線2的距離,是1。把這個數帶入函數距離(d帽),然後乘以2,就得到兩條虛線間的間隔

看到了嗎?這就是當初我們要最大化的那個式子。
還記得那個限制條件嗎?

不等式右邊的1 ,就是函數距離(d帽)。
也就是硬間隔支持向量機,它的數學模型爲:

2,鬆弛變量是函數間隔

上面的一種情況是,我們找了兩條直線,最大化他們的距離。但有時我們找的直線,它們中間有一些散落的點,這些點不滿足那個限制條件。如下圖所示:

不滿足的樣本,如圖紅色標註的4個點。
也就是由於這些特殊的點,限制條件不滿足。這真是一隻老鼠壞一鍋湯!
怎麼辦呢?就該我們的主角上場了,對,就是鬆弛變量ξ。
爲了方便敘述與理解,我只拿其中的一個點分析,下圖中的紅色點。
看圖:

藍色的線的長度就是引入的鬆弛變量ξ(ξ≥0)
由於d帽=1,相應的綠色的線的長度就是1-ξ
此時,紅色的點到橙色的線(我們要確定的最終分割線),之間的函數距離爲:

對於所有的樣本點,都滿足:

這就是引入鬆弛變量後的限制條件。
這就是軟間隔支持向量機,它的數學模型爲:

其中m是樣本個數

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章