漫步最優化十一——局部極小與極大的充分必要條件(上)


便






——

梯度g(x) 與海森矩陣H(x) 在局部極小值點x 上必須滿足某些條件,兩個條件集如下:

  1. 在局部極小值點x 處必須滿足的條件,他們是必要條件。
  2. 保證x 是局部極小值點點條件,他們是充分條件。

充分必要條件可以用許多定理的形式進行描述,這些定理中使用比較廣泛的概念就是可行方向的概念。

1δ=αdx 上的變化量,其中α 是正常數,d 是方向向量,如果R 是可行域且存在常數α̂ >0 使得對所有α,x+αdR ,其中0αα̂  ,那麼稱d 爲點x 的可行方向。

效果上,如果點x 沿方向d 移動有限的距離後依然在R 中,那麼d 就是x 的可行方向向量。

1 優化問題的可行域爲

R={x:x12,x20}

如圖1所示,對於點x1=[4 1]T,x2=[2 3]T,x3=[1 4]T ,向量d1=[2 2]T,d2=[0 2]T,d3=[2 0] 那個是可行方向?

α̂ =1 ,在0αα̂  範圍內的所有α

x1+αd1R

d1 是點x1 處的可行方向;對任意0αα̂ 

x1+αd2Rx1+αd3R

因此d2,d3x1 的可行方向。

因爲不存在常數α̂ >0 使得

x2+αd1Rfor 0αα̂ 

,所以d1 不是x2 處的可行方向。另一方面,存在正數α̂  使得對0αα̂  而言

x2+αd2Rx2+αd3R

,所以d2,d3x2 的可行方向。


這裏寫圖片描述
圖1

因爲x3 不在R 中,所以不存在α̂  是的對任意的d

x3+αdRfor 0αα̂ 

,因此d1,d2,d3 不是x3 的可行方向。


目標函數要想有極小值,必須滿足裏兩個條件,也就是一階與二階條件,一階條件是一階導數的形式,如梯度。

1 極小值的一階必要條件。

  • 如果f(x)C1,x 是局部最小值點,那麼對於x 處的所有可行方向
    g(x)Td0
  • 如果xR 的內點,那麼
    g(x)=0

(a) 如果dx 的可行方向,那麼

x=x+αdRfor 0αα̂ 

利用泰勒級數

f(x)=f(x)+αg(x)Td+o(αd)

如果

g(x)Td<0

那麼當α0

αg(x)Td+o(αd)<0

那麼

f(x)<f(x)

這與假設x 是極小值相矛盾,因此x 爲極小值的必要條件是

g(x)Td0

(b) 如果xR 的內點,所有可行方向的向量均存在,那麼由(a) 可知,向量d=d1 產生

g(x)Td10

同樣的,對於方向d=d1

g(x)Td10

因此在這種情況下,x 是極小值的必要條件是

g(x)=0


二階必要條件涉及到一階與二階導,或者等價的梯度與海森矩陣。

1

  • d 是點x 處的任意方向向量,如果對任意的d0,dTHd>0,0,0,<0 ,那麼稱二次項dTH(x)d 爲正定,半正定,半負定,負定。如果dTH(x)d 既可以爲正也可以爲負,那麼稱其爲不定的。
  • 如果dTH(x)d 是正定,半正定等,那麼稱矩陣H(x) 爲正定,半正定等矩陣。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章