上篇博客開始了我的凸優化之旅,介紹了凸集和凸函數的定義,這篇博客給出凸函數非常有用的性質和判別條件,並給出其數學證明,同時給出強凸函數定義。
首先勘誤一下上篇博客關於嚴格凸的定義,其條件不是λ∈[0,1],而是λ∈(0,1)
1、性質1:局部最優就是全局最優
證明: 利用反證法進行證明,假設f(x∗)爲找到的一個局部最小值,假設還存在一個f(xn)更小,即
f(x∗)>f(xn)
則在凸集S上,由凸函數定義有
f(x∗+λ(xn−x∗))≤λf(xn)+(1−λ)f(x∗)
其中λ∈[0,1],如果令λ不爲0,則f(x∗+λ(xn−x∗))<f(x∗),顯然可以很輕鬆地找到合適的λ使得x∗+λ(xn−x∗)非常靠近x∗,這將與f(x∗)是局部最小相矛盾。
2、性質2:一階條件,設f(x)在凸集S上具有一階連續偏導,則f(x)爲S上的凸函數的充要條件爲
∀x1,x2∈S,f(x2)≥f(x1)+▽f(x1)T(x2−x1)
證明:
(1) 首先考慮一元函數情形
充分性: 由凸函數定義有f(x1+λ(x2−x1))≤λf(x2)+(1−λ)f(x1)
假設λ∈(0,1],則不等式2邊同除λ,得
f(x2)≥f(x1)+λf(x1+λ(x2−x1))−f(x1)
令λ趨近於0即可得f(x2)≥f(x1)+f′(x1)(x2−x1)
必要性: 取z=λx1+(1−λ)x2,則
f(x1)≥f(z)+f′(z)(x1−z)
f(x2)≥f(z)+f′(z)(x2−z)
上述2式分別乘以λ和1−λ則可得f(z)≤λf(x1)+(1−λ)f(x2)
多元函數的證明與一元函數思路類似。
3、性質3:二階條件,設函數f(x)在開凸集S上具有二階連續偏導,f(x)爲凸函數的充要條件是函數的Hessian矩陣在S上處處半正定。
二階判別條件的證明留作下篇給出。