凸優化理論(2)

上篇博客開始了我的凸優化之旅,介紹了凸集和凸函數的定義,這篇博客給出凸函數非常有用的性質和判別條件,並給出其數學證明,同時給出強凸函數定義。

首先勘誤一下上篇博客關於嚴格凸的定義,其條件不是λ[0,1]\lambda \in [0,1],而是λ(0,1)\lambda \in (0,1)
1、性質1:局部最優就是全局最優
證明: 利用反證法進行證明,假設f(x)f(x^*)爲找到的一個局部最小值,假設還存在一個f(xn)f(x_n)更小,即
f(x)>f(xn)f(x^*)>f(x_n)
則在凸集SS上,由凸函數定義有
f(x+λ(xnx))λf(xn)+(1λ)f(x)f(x^*+\lambda (x_n-x^*))\leq \lambda f(x_n)+(1-\lambda)f(x^*)
其中λ[0,1]\lambda \in [0,1],如果令λ\lambda不爲0,則f(x+λ(xnx))<f(x)f(x^*+\lambda (x_n-x^*))<f(x^*),顯然可以很輕鬆地找到合適的λ\lambda使得x+λ(xnx)x^*+\lambda (x_n-x^*)非常靠近xx^*,這將與f(x)f(x^*)是局部最小相矛盾。

2、性質2:一階條件,設f(x)f(x)在凸集SS上具有一階連續偏導,則f(x)f(x)SS上的凸函數的充要條件爲
x1,x2S,f(x2)f(x1)+f(x1)T(x2x1)\forall x_1,x_2\in S , f(x_2)\geq f(x_1)+\triangledown f(x_1)^T(x_2-x_1)
證明:
(1) 首先考慮一元函數情形
充分性: 由凸函數定義有f(x1+λ(x2x1))λf(x2)+(1λ)f(x1)f(x_1+\lambda (x_2-x_1)) \leq \lambda f(x_2)+(1-\lambda)f(x_1)
假設λ(0,1]\lambda \in (0,1],則不等式2邊同除λ\lambda,得
f(x2)f(x1)+f(x1+λ(x2x1))f(x1)λf(x_2)\geq f(x_1)+\frac{f(x_1+\lambda (x_2-x_1))-f(x_1)}{\lambda}
λ\lambda趨近於0即可得f(x2)f(x1)+f(x1)(x2x1)f(x_2)\geq f(x_1)+f'(x_1)(x_2-x_1)

必要性: 取z=λx1+(1λ)x2z=\lambda x_1+(1-\lambda) x_2,則
f(x1)f(z)+f(z)(x1z)f(x_1)\geq f(z)+f'(z)(x_1-z)
f(x2)f(z)+f(z)(x2z)f(x_2)\geq f(z)+f'(z)(x_2-z)
上述2式分別乘以λ\lambda1λ1-\lambda則可得f(z)λf(x1)+(1λ)f(x2)f(z)\leq \lambda f(x_1) + (1-\lambda)f(x_2)

多元函數的證明與一元函數思路類似。
3、性質3:二階條件,設函數f(x)f(x)在開凸集SS上具有二階連續偏導,f(x)f(x)爲凸函數的充要條件是函數的HessianHessian矩陣在SS上處處半正定。
二階判別條件的證明留作下篇給出。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章