凸優化

凸優化

內積

定義在n維實向量集合Rn 上的標準內積爲,對任意的x,yRn

<x,y>=xTy=i=1nxiyi

採用符號xTy 代替<x,y> 。向量xRn 的Euclid範數,或l2 -範數,定義爲
x2=(xTx)12=(x21++x2n)12

對於任意的x,yRn ,Cauchy-Schwartz不等式是|xTy|x2y2 。兩個非零向量x,yRn 之間(無符號)的夾角定義爲
(x,y)=arccos(xTyx2y2)

其中,我們取arccos(u)[0,π]

定義在m×n 實矩陣集合Rm×n 上的標準內積爲,對任意X,YRm×n

<X,Y>=tr(XTY)=i=1nj=1nXijYij

上確界和下確界

假定CR 。如果對每一個xC 成立xa 則稱a是C的上界。C的上界組成的集合或者是空集(此時稱C無上界),或者等於R (僅當C= ,或者是閉的無限區間[b,) 。我們稱b爲C的最小上界或上確界,用supC 表示。我們規定sup= ,當C無上界時取supC= 。當supCC 時,我們說C的上確界是可達的。

類似地,我們可以定義下界和下確界。如果對每一個xC 成立ax 則稱a是C的下界。CR 的下確界(或最大下界)定義爲infC=sup(C) 。我們規定inf= ,並在C無下界時,取infC=

基本的矩陣-向量運算成本

向量運算

爲了完成兩個向量x,yRn 的內積運算xTy ,我們要先計算乘積xiyi 然後將它們相加,這需要n 次乘法和n1 次加法,或者2n1 次浮點運算。如上所述,我們只保留主導項,稱內機運算需要2n 次浮點運算。標量-向量乘積αx ,其中αR,xRn ,耗費n 次浮點運算。兩個向量的加法也耗費n 次浮點運算。如果向量xy 時稀疏的,這些基本運算可以更快地完成(如果向量用恰當的數據結構存儲)。

矩陣-向量相乘

矩陣-向量相乘y=Ax ,其中ARm×n ,成本爲2mn 次浮點運算:我們必須算ym 個分量,每個分量是A 的行向量和x 的乘積,即兩個Rn 向量的內積。利用A 的結構經常可以對矩陣-向量相乘運算進行加速,如果A 是稀疏矩陣,僅有(總數爲mn 中的)N 個非零元素,那麼只需要2N 次浮點運算就可以確定Ax

矩陣-矩陣相乘

矩陣-矩陣相乘C=AB ,其中ARm×nBRn×p ,需要2mnp 次浮點運算。因爲我們需要計算Cmp 個元素,而每個元素是兩個長度爲n 的向量的內積。同樣,經常可以利用AB 的結構大幅度節省計算量。

符號

一些特殊的集合

符號 意義
R 實數
Rn n 維向量(n×1 矩陣)
Rm×n m×n 矩陣
R+,R++ 非負、正實數
C 複數
Cn n 維向量
Cm×n m×n 矩陣
Z 整數
Z+ 非負整數
Sn 對稱n×n 矩陣
Sn+,Sn++ 對稱半正定、正定n×n 矩陣

向量和矩陣

符號 意義
1 所有分量爲1的向量
ei i 個標準基分量
I 單位矩陣
XT 矩陣X 的轉置
XH 矩陣X 的Hermitian(複共軛)轉置
trX 矩陣X 的跡
λi(X) 對稱矩陣X 的第i 大特徵值
λmax(X),λmin(X) 對稱矩陣X 的最大、最小特徵值
σi(X) 對稱矩陣X 的第i 大奇異值
σmax(X),σmin(X) 對稱矩陣X 的最大、最小奇異值
X+ 矩陣X 的Moore-Penrose逆或僞逆
xy 向量xy 正交:xTy=0
V 子空間V 的正交補
diag(x) 對角元素爲x1,,xn 的對角矩陣
diag(X,Y,) 對角塊爲X,Y, 的分塊對角矩陣
rankA 矩陣A 的秩
R(A) 矩陣A 的值域
N(A) 矩陣A 的零空間

範數和距離

符號 意義
範數
範數 的對偶範數
x2 向量x 的Euclid(或l2 -)範數
x1 向量xl1 -範數
x 向量xl -範數
X2 矩陣X 的譜範數(最大奇異值)
B(c,r) c 爲中心r 爲半徑的球
dist(A,B) 集合(或點)AB 之間的距離

廣義不等式

符號 意義
xy 向量xy 之間的分量不等式
xy 向量xy 之間的嚴格分量不等式
XY 對稱矩陣XY 之間的矩陣不等式
XY 對稱矩陣XY 之間的嚴格矩陣不等式
xKy 由正常錐K 導出的廣義不等式
xKy 由正常錐K 導出的嚴格廣義不等式
xKy 對偶廣義不等式
xKy 對偶嚴格廣義不等式

拓撲與凸分析

符號 意義
cardC 集合C 的基數
intC 集合C 的內部
relintC 集合C 的相對內部
clC 集合C 的閉包
bdC 集合C 的邊界:bdC=clCintC
convC 集合C 的凸包
affC 集合C 的仿射包
K K 的對偶錐
IC 集合C 的示性函數
SC 集合C 的支撐函數
f f 的共軛函數

概率

符號 意義
EX 隨機向量X 的期望值
probS 事件S 的概率
varX 標量隨機變量X 的方差
N(c,) 均值爲c 、協方差(矩陣)爲 的高斯分佈
Φ 隨機變量N(0,1) 的累積分佈函數

函數和導數

符號 意義
f:AB f 是從集合domfA 到集合B 的函數
domf 函數f 的定義域
epif 函數f 的上境圖
f 函數f 的導數
2f 函數f 的Hessian矩陣
Df 函數f 的導數(Jacobian)矩陣
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章