Intorduction
在上節中,我們討論了線性規劃中的對偶,引入了對偶的基本概念和對偶的兩種解釋。對偶相當於給當前的優化問題找到了一個下界,通過提升這個下界來找到原問題的最優解。本節將進一步介紹對偶在一般規劃問題中的推廣。
拉格朗日對偶函數
考慮一般的最小化問題:
xminsubject tof(x)hi(x)≤0, i=1,...,mli(x)=0, j=1,...,r
這裏不需要一定是凸函數,當然我們主要研究凸函數的情況。我們定義拉格朗日方程(Lagrangian)爲:
L(x,u,v)=f(x)+i=1∑muihi(x)+j=1∑rvili(x)
新變量u∈Rm,v∈Rr,且u≥0。其一個重要的特性是,對於所有可行點x,
f(x)≥L(x,u,v)
正如上節所示,如果C表示原問題的可行域,f∗表示原問題的最優解,那麼對於任意u和v≥0,
f∗≥x∈CminL(x,u,v)≥xminL(x,u,v):=g(u,v)
我們稱g(u,v)爲拉格朗日對偶函數(Lagrange dual function)。它給出了f∗的一個下限。其中,u≥0和v稱之爲對偶變量。
例子:二次規劃
考慮二次規劃問題::
xminsubject to21xTQx+cTxAx=b, x≥0
其中,Q≻0。拉格朗日方程爲:
L(x,u,v)=21xTQx+cTx−uTx+vT(Ax−b)
拉格朗日對偶函數爲:
g(u,v)=xminL(x,u,v)=−21(c−u+ATv)TQ−1(c−u+ATv)−bTv
對於任意u≥0和v,g(u,v)作爲下界約束着原函數最優解f∗的取值。
拉格朗日對偶問題
已知對於任意u≥0和v,f∗≥g(u,v)。因此最好的下界是:在u,v可行域上最大化g(u,v)。這就得到了拉格朗日對偶問題(Lagrange dual problem):
u,vmaxsubject tog(u,v)u≥0
一個關鍵的性質稱爲弱對偶(weak duality):如果對偶最優解爲g∗,那麼f∗≥g∗。
另一個關鍵性質是:對偶問題總是凸優化問題。
無論原問題是不是凸的,這兩個性質總是成立的。
強對偶
弱對偶告訴我們f∗≥g∗總是成立的。而在一些問題中,我們可以得到f∗=g∗,該性質稱之爲強對偶。
Slater條件
Slater’s condition: 如果原問題是凸優化問題(即f和h1,...,hm是凸函數,l1,...,lr是放射函數),那麼至少存在一個嚴格可行點x∈Rn,即
h1(x)<0,...,hm(x)<0且l1(x)=0,...,lr(x)=0滿足強對偶。
可以驗證的是,對於線性規劃問題,LP對偶的對偶就是原LP問題。且LP問題總是有強對偶性。
例子:支持向量機
給定y∈{−1,1}n,X∈Rn×p有行向量x1,...,xn,則支持向量機(SVM)定義爲:
β,β0,ξminsubject to21∥β∥22+Ci=1∑nξiξi≥0, i=1,...,nyi(xiTβ+β0)≥1−ξi, i=1,...,n
引入對偶變量v,w≥0,可以得到拉格朗日方程:
L(β,β0,ξ,v,w)=21∥β∥2+Ci=1∑nξi−i=1∑nviξi+i=1∑nwi(1−ξi−yi(xiTβ+β0))
則拉格朗日對偶函數爲:
β,β0,ξminL=g(v,w)=⎩⎨⎧−21wTX~X~Tw+1Tw−∞if w=C1−v, wTy=0otherwise
其中,X~=diag(y)X。因此,SVM的對偶問題消除了鬆弛變量v:
wmaxsubject to−21wTX~X~Tw+1Tw0≤w≤C1, wTy=0
可以看到,Slater條件是滿足的,因而SVM是有強對偶性的。
對偶間隙
給定原變量x和對偶變量u,v,則f(x)−g(u,v)稱爲對偶間隙(duality gap)。注意到f(x)−f∗≤f(x)−g(u,v),所以當對偶間隙爲0時,x就是原問題的最優解(同時,u,v也是對偶問題的最優解)。
從算法角度來看,只要給定一個停止閾值:f(x)−g(u,v)≤ϵ,那麼就可以保證f(x)−f∗≤ϵ。