凸优化理论(2)

上篇博客开始了我的凸优化之旅,介绍了凸集和凸函数的定义,这篇博客给出凸函数非常有用的性质和判别条件,并给出其数学证明,同时给出强凸函数定义。

首先勘误一下上篇博客关于严格凸的定义,其条件不是λ[0,1]\lambda \in [0,1],而是λ(0,1)\lambda \in (0,1)
1、性质1:局部最优就是全局最优
证明: 利用反证法进行证明,假设f(x)f(x^*)为找到的一个局部最小值,假设还存在一个f(xn)f(x_n)更小,即
f(x)>f(xn)f(x^*)>f(x_n)
则在凸集SS上,由凸函数定义有
f(x+λ(xnx))λf(xn)+(1λ)f(x)f(x^*+\lambda (x_n-x^*))\leq \lambda f(x_n)+(1-\lambda)f(x^*)
其中λ[0,1]\lambda \in [0,1],如果令λ\lambda不为0,则f(x+λ(xnx))<f(x)f(x^*+\lambda (x_n-x^*))<f(x^*),显然可以很轻松地找到合适的λ\lambda使得x+λ(xnx)x^*+\lambda (x_n-x^*)非常靠近xx^*,这将与f(x)f(x^*)是局部最小相矛盾。

2、性质2:一阶条件,设f(x)f(x)在凸集SS上具有一阶连续偏导,则f(x)f(x)SS上的凸函数的充要条件为
x1,x2S,f(x2)f(x1)+f(x1)T(x2x1)\forall x_1,x_2\in S , f(x_2)\geq f(x_1)+\triangledown f(x_1)^T(x_2-x_1)
证明:
(1) 首先考虑一元函数情形
充分性: 由凸函数定义有f(x1+λ(x2x1))λf(x2)+(1λ)f(x1)f(x_1+\lambda (x_2-x_1)) \leq \lambda f(x_2)+(1-\lambda)f(x_1)
假设λ(0,1]\lambda \in (0,1],则不等式2边同除λ\lambda,得
f(x2)f(x1)+f(x1+λ(x2x1))f(x1)λf(x_2)\geq f(x_1)+\frac{f(x_1+\lambda (x_2-x_1))-f(x_1)}{\lambda}
λ\lambda趋近于0即可得f(x2)f(x1)+f(x1)(x2x1)f(x_2)\geq f(x_1)+f'(x_1)(x_2-x_1)

必要性: 取z=λx1+(1λ)x2z=\lambda x_1+(1-\lambda) x_2,则
f(x1)f(z)+f(z)(x1z)f(x_1)\geq f(z)+f'(z)(x_1-z)
f(x2)f(z)+f(z)(x2z)f(x_2)\geq f(z)+f'(z)(x_2-z)
上述2式分别乘以λ\lambda1λ1-\lambda则可得f(z)λf(x1)+(1λ)f(x2)f(z)\leq \lambda f(x_1) + (1-\lambda)f(x_2)

多元函数的证明与一元函数思路类似。
3、性质3:二阶条件,设函数f(x)f(x)在开凸集SS上具有二阶连续偏导,f(x)f(x)为凸函数的充要条件是函数的HessianHessian矩阵在SS上处处半正定。
二阶判别条件的证明留作下篇给出。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章