今天開始學Convex Optimization:第3章 Convex Sets and Convex functions

第3章 Convex Sets and Convex functions

凸優化問題的定義

在這裏插入圖片描述

凸集的定義:

定義:給定一個集合CRnC \subseteq \mathbb{R}^n,滿足下列條件則稱爲凸集:x,yCtx+(1t)yCx,y \in C \Rightarrow tx+(1-t)y \in C 對於任意的 0t10≤t≤1

在這裏插入圖片描述
直觀上看,可以利用下圖幫助理解,假定我們的變量在二維空間中,x,y爲二維空間變量,黑體線代表的向量爲tx+(1−t)y,t取值範圍爲[0,1],那麼無論t怎麼變化,向量tx+(1−t)y總會落在x和y張成的集合空間中。[3]
在這裏插入圖片描述

那麼從定義出發,我們也能知道非凸集的情況,下圖左側爲凸集,右圖爲非凸集。一句話來概括凸集就是集合內任意兩點間連線依舊在集合內。
在這裏插入圖片描述

convex hull(凸包) 定義:

在這裏插入圖片描述
給定集合內的任意k個元素x1,...,xkRnx_1,...,x_k \in \mathbb{R}^n,任意的線性組合形式:θ1x1+...+θkxk,θi0,i=1kθi=1\theta_1 x_1+...+\theta_k x_k,\theta_i \geq 0, \sum_{i=1}^{k}\theta_i=1,稱之爲集合的convex hull,表示爲conv(C)conv(C)。convex hull總是凸的。可以直觀認爲凸包就是最外圍的元素所圍成的集合外殼,下圖是兩個凸包的例子:

在這裏插入圖片描述

一些凸集的examples:

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

錐(Cone)和凸錐(Convex Cone)的定義

在這裏插入圖片描述
在這裏插入圖片描述

範數錐(Norm cone):{(x,t):xt}\left \{(x,t):||x|| \leq t \right \},對於一範數和二範數成立。下圖取定不同的t做出了三維情況下的圖

(討論:這裏我感覺用字母tt有一些歧義,和上面定義中的tt不是一個含義。範數錐中的tt是定義域中的一個維度變量;而上面錐定義中的tt是表示一個常數):

在這裏插入圖片描述

凸集的性質:

  • 可分離超平面理論(Separating hyperplane theorem):兩個不相交的凸集總存在一個超平面能將兩者分離,如果CD=C⋂D=∅,那麼總存在着a,b使得有: C{x:aTxb}C \subseteq \left \{x:a^Tx \leq b \right \}D{x:aTxb}D \subseteq \left \{x:a^Tx \geq b \right \}

在這裏插入圖片描述

  • 支撐超平面理論(Supporting hyperplane theorem):凸集邊界上的一點必然存在一個支撐超平面穿過該點,即如果C都是非空凸集,
    x0bound(C)x_0 \in bound(C),那麼必然存在一個超平面a,使得, C{x:aTxaTx0}C \subseteq \left \{x:a^Tx \leq a^T x_0 \right \}。如下圖:

在這裏插入圖片描述

保凸操作:

在這裏插入圖片描述
(上面是f1(D)f^{-1}(D),因爲借用了[3]的截圖,就不重新打了。)

一個例子:

這一章都是一些概念,看的有點暈,哈哈。下面看一下一個證明的例子:

給定一系列的n×nn\times n的對稱矩陣,有一種線性矩陣不等式如下,其中xRkx \in R^k。證明:xx組成的集合C是凸集。
在這裏插入圖片描述

證明過程思路上面寫了:只要根據前面提過的凸集定義去證明就行了。如果有x,yCx,y \in C,只要證明tx+(1t)yCtx+(1-t)y \in C
其中0t10\leq t \leq 1,就可以了。根據題目,我們可以知道:
tvTBvi=1ktxivTAiv0(1t)vTBvi=1k(1t)yivTAiv0 tv^T B v - \sum_{i=1}^{k}tx_iv^TA_i v \geq 0 \\ (1-t)v^T B v - \sum_{i=1}^{k}(1-t)y_iv^TA_i v \geq 0

然後我們可以推出

vT(Bi=1k(txi+(1t)yi)Ai)v=vTBvi=1k(txi+(1t)yi)vTAiv=(t+(1t))vTBvi=1k(txi+(1t)yi)vTAiv0 v^T \left(B - \sum_{i=1}^{k}(tx_i + (1-t)y_i)A_i \right) v \\ = v^T B v - \sum_{i=1}^{k}(tx_i + (1-t)y_i)v^TA_i v \\ = (t + (1-t))v^T B v - \sum_{i=1}^{k}(tx_i + (1-t)y_i)v^TA_i v \geq 0\\

所以vT(Bi=1k(txi+(1t)yi)Ai)v0v^T \left(B - \sum_{i=1}^{k}(tx_i + (1-t)y_i)A_i \right) v \geq 0,即 i=1k(txi+(1t)yi)AiB\sum_{i=1}^{k}(tx_i + (1-t)y_i)A_i \preceq B,即證明了tx+(1t)yCtx+(1-t)y \in C。所以xx組成的集合C是凸集。

Convex Function

定義:給定映射f:RnRf:\mathbb{R}^n \rightarrow \mathbb{R}並且dom(f)Rn\text{dom} (f) \subseteq \mathbb{R}^n爲凸集,那麼

f(tx+(1t)y)tf(x)+(1t)f(y)f(tx+(1-t)y) \leq tf(x)+(1-t)f(y) 對於任意0t10\leq t \leq1,且 任意x,ydom(f)x,y\in \text{dom}(f)。如下圖:

在這裏插入圖片描述
從上圖可以看出,ff的函數值總是位於連接f(x)f(x)f(y)f(y)之間的直線下方。
類比可以理解一下concave函數的定義,很容易得到負的convex函數就是concave函數。

在這裏插入圖片描述

Strictly Convex和Strongly Convex

在這裏插入圖片描述

一些凸函數的例子:
在這裏插入圖片描述

凸函數重要的一階特性(First-order characterization)

假設ff處處可微,則ff爲凸函數,當且僅當dom(f)\text{dom}(f)爲凸,並且對於所有x,ydom(f)x,y\in \text{dom}(f)

f(y)f(x)+f(x)T(yx)f(y) \geq f(x)+\nabla f(x)^T(y-x)

一階特性也說明了對於一個可微凸函數fff(x)=0\nabla f(x)= 0 等價於 xx minimizes ff

證明一階特性:根據凸函數的定義有(如果y=xy=x,上面性質顯然成立)

f(ty+(1t)x)tf(y)+(1t)f(x)f(t(yx)+x)f(x)t(f(y)f(x))f(ty+(1-t)x) \leq tf(y)+(1-t)f(x) \\ f(t(y-x)+x) - f(x) \leq t(f(y)-f(x)) \\

假設yx>0y-x > 0可以推出下面結果;如果yx<0y-x < 0下面的不等號相反,最後得到的結果是一致的。這裏我們按照假設yx>0y-x > 0來推:

f(t(yx)+x)f(x)t(yx)f(y)f(x)yx\frac{f(t(y-x)+x)-f(x)}{t(y-x)}\leq \frac{f(y)-f(x)}{y-x}

觀察左邊:

limt0f(t(yx)+x)f(x)t(yx)=f(x)\lim_{t\rightarrow0} \frac{f(t(y-x)+x)-f(x)}{t(y-x)}=\nabla f(x)

代入得到:

f(x)(yx)f(y)f(x)\nabla f(x)(y-x) \leq f(y)-f(x)

所以:f(y)f(x)+f(x)(yx)f(y) \geq f(x)+\nabla f(x)(y-x)

凸函數的二階特性

二階特性:如果函數二階可微分,則ff爲凸函數,當且僅當dom(f)\text{dom}(f)爲凸,且對於所有xdom(f)x\in \text{dom}(f) 都有2f(x)0\nabla^2 f(x)\succeq 0

Jensen’s Inequality

假若ff爲凸,並且XXdom(f)dom(f)所支持的隨機變量,則有f(E[x])E[f(x)]f(E[x])≤E[f(x)]。Jensen’s inequality很重要,可以簡單記憶成,期望的函數值小於等於函數的期望,期望也可以用均值來代替。

保凸操作

在這裏插入圖片描述
其中the set SS is the number of functions f(x)f(x), which can be infinite.

在這裏插入圖片描述
好了,本篇就到這裏,借鑑了參考資料中的很多內容。下一章繼續。

參考資料

[1] Convexity I: Sets and Functions
[2] http://www.stat.cmu.edu/~ryantibs/convexopt/scribes/convex-fns-scribed.pdf
[3] https://www.cnblogs.com/Lin-chun/p/6875184.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章