Peter教你談情說AI | 11支持向量機(中)—用拉格朗日解決SVM原型

可視化約束條件對函數的約束

如果在三維直角座標系中將 f ( x , y ) 做出圖來——把 f ( x , y ) “畫出圖來”——會是一個三維空間的曲面——這樣一個函數實際上表達了 x , y , z 三者之間的關係。

函數 f ( x , y ) 的約束條件爲: g ( x , y ) = 0 。

那麼,一個二維圖形對一個三維圖形的約束從何體現呢?如圖:

在這個例子中,我們可以看到 f ( x , y ) 是存在極大值的,同時因爲約束條件是 g ( x , y ) = 0 ,所以,如果我們要取如下目標的話:

對應點一定位於 g ( x , y ) = 0 投影到 f ( x , y ) 上之後形成的那條曲線上,比如上圖中的點 B。儘管它不一定是 z = f ( x , y ) 的極大值,但卻是符合約束條件 g ( x , y ) = 0 的極大值!

拉格朗日乘子法

目標函數轉換:

上一節介紹了線性可分 SVM 的目標函數:

們可以再抽象一步,將其概括爲:

這個約束條件其實可以寫作:

因爲不等式約束條件難度稍大,我們先從等式約束條件開始。

等式約束條件:

我們的目標函數變爲:

現在我們在一張圖中做出f(x,y)和g(x,y)的等高線(三維圖形投影到二維平面後的結果),形如圖:

綠線是g(x,y)的等高線,藍線是f(x,y)的等高線。圖中兩條藍線具體對應的函數分別是f(x,y)=d1和f(x,y)=d2。d1和d2是兩個常數,對應上圖中兩個藍圈對應的z軸座標。此處d2<d1。

我們設紅點的自變量值爲

,則在紅點處

的梯度與f(x,y)=d2在

處的切線垂直,

的梯度與g(x,y)=0在

處的切線垂直。

又因爲f(x,y)=d2對應的藍線與g(x,y)=0對應的綠線在

處是相切的。所以在

點處f(x,y)與g(x,y)的梯度,要麼方向相同,要麼方向相反。

所以,一定存在

,使得:

這時我們將 λ 稱爲拉格朗日乘子

定義拉格朗日函數

——其中 λ 是拉格朗日乘子。

拉格朗日函數把原本的目標函數和其限制條件整合成了一個函數。於是,原本有約束的優化問題,就可以轉化爲對拉格朗日函數的無約束優化問題了。

不等式約束條件

瞭解了約束條件是等式的情況,我們再來看約束條件是不等式的情況。

原命題如下:

首先,仍然構造拉格朗日函數:

令:

那麼原命題就等價於:

拉格朗日對偶問題

現在我們已經把不等式的約束問題也轉變爲了一個p*的問題。

但仍然個很難解決的問題,因爲我們要先解決不等式約束的max問題,然後再在w上求最小值。怎麼辦呢?如果能把順序換一下,先解決關於w的最小值,在解決關於a的不等式約束問題就好了。即:

這個d*就是p*的對偶形式,也即原問題的對偶形式,可惜的是,對偶歸對偶,卻未必相等!因爲:

這個不等式叫弱對偶性質(Week Duality),最大值中最小的一個,也要大於等於最小值中最大的一個。這個性質從常識上想想,也是可以理解的。同時,我們可以得到一個對偶間隙,即p*-d*。

在凸優化理論中,有一個Slater定理,當這個定理滿足,那麼對偶間隙就會消失,即:

此時稱爲強對偶性質(strong Duality)。幸運的是,我們這裏滿足Slater定理。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章