【深度學習】梳理凸優化問題（五）

原創

斐虹

2020-03-09 17:48

文章目錄

正定和半正定矩陣

約束優化問題

$\begin{array}{rcl}&&min_w\;f(w)\\s.t.\;g_i(w)&\leq&0\;(i=1,...,k)\\h_j(w)&=&0\;(j=1,...,n)\\&& \end{array}$

注：

這是一個最小化問題.
不等式約束嚴格執行的含義是“小於等於號”變成“小於號”。

凸函數

對區間 $[a,b]$ 上定義的函數 f，若它對區間中任意兩點 $x_1,x_2$ 均有：
$f(\frac{x_1+x_2}{2})\le\frac{f(x_1)+f(x_2)}{2}$
則稱f爲區間 [a,b]上的凸函數，這和高數上講圖形的形狀時是不同的概念。

形曲線的函數如 $f(x)=x^2$ 就是凸函數。

對實數集上的函數，可通過求解二階導數來判別：

若二階導數在區間上非負，則稱爲凸函數
若二階導數在區間上恆大於0，則稱嚴格凸函數

仿射函數也是凸函數，只是不是嚴格凸函數。

凸優化問題

凸優化問題是特殊的約束最優化問題。其一般形式形式和約束最優化問題一樣。

假設f、g、h在定義域內是連續可微的，且目標函數f和不等式約束函數g是凸函數，等式約束h是仿射函數（線性函數），則這種約束最優化問題稱爲凸優化問題。
因此凸優化問題特徵的重要特徵：

目標函數f，不等式約束函數g是凸函數
等式約束h是仿射函數
滿足約束最優化問題的一般形式

凸二次規劃問題

凸二次規劃問題是凸優化問題的一個特殊形式，當目標函數是二次型函數且約束函數 g 是仿射函數時，就變成一個凸二次規劃問題。凸二次規劃問題的一般形式爲:
$min_w\frac12x^TQx+c^Tx\\s.t.\;Wx\leq b$

若 Q 爲半正定矩陣，則上面的目標函數是凸函數，相應的二次規劃爲凸二次規劃問題；此時若約束條件定義的可行域不爲空，且目標函數在此可行域有下界，則該問題有全局最小值。
若Q爲正定矩陣，則該問題有唯一的全局最小值。例如，最簡單的正定矩陣就是單位矩陣。

凸二次規劃問題的特徵：

**目標函數f是二次型函數函數 **
等式約束h是仿射函數
等式約g是仿射函數
滿足約束最優化問題的一般形式

常用的二次規劃問題求解方法有：

橢球法
內點法
增廣拉格朗日法
梯度投影法

額外補充

正定和半正定矩陣

這裏貼上一個博客的解釋，看了比較好理解：https://www.cnblogs.com/marsggbo/p/11461155.html
正定矩陣(PD)

給定一個大小爲 n×n 的實對稱矩陣 A ，若對於任意長度爲 n 的非零向量 X，有 $X^TAX>0$ 恆成立，則矩陣 A 是一個正定矩陣。

半正定矩陣(PSD)

給定一個大小爲 n×n 的實對稱矩陣 A ，若對於任意長度爲 n 的非零向量 X，有 $X^TAX\le0$ 恆成立，則矩陣 A 是一個半正定矩陣。

具體解釋：以正定矩陣爲例，它需要滿足 $X^TAX>0$ ,而且我們知道矩陣相乘(如AX)的本質是將向量X按照矩陣A所指定的方式進行變換(你可以通過閱讀理解矩陣等系列文章來對矩陣乘法產生更加深刻的理解)。

我們可以記M=AX,那麼對於正定矩陣有 $X^TAX=X^TM>0$ ，看到這有沒有想起cos公式呢？如下：

$cos(θ)=\frac{a^Tb}{||a||×||b||}$

所以正定矩陣是個什麼意思呢？實際上就是說對於一個向量X,我們希望 X在經過有一個矩陣A的變化後得到的新的向量M和它本身的夾角小於90度。而小於90度背後的含義是變換後的向量M是沿着原向量X的正方向進行縮放的（即 M投影回原向量時方向不變）。

而上面這句話還可以從特徵向量的角度進一步理解,在介紹之前我們回顧一下特徵值和特徵向量的概念：首先一個矩陣A的特徵向量x就是表示某個向量會沿着特徵向量的方向進行變換（縮放），縮放比例由特徵值λ決定。例如：

$A_1=\begin{bmatrix}0.5&0\\0&2\end{bmatrix}$

很簡單地可以計算得到A的特徵值分別是0.5和2，而它們對應的特徵向量分別是 $[1,0]^T$ 和 $[0,1]^T$ 。所以如果一個向量b左乘一個矩陣A，其本質就是將向量b沿着 $[1,0]^T$ 和 $[0,1]^T$ 方向分別放大0.5和2倍。我們假設b= $[2,2]^T$ ，那麼Ab最終得到的向量爲 $[1,4]^T$ ，結合下圖看更加直觀：

我們看上圖，如果其中一個特徵值小於0，比如 $λ1<0$ 那麼最終得到的向量Ab−→投射到b→方向的向量與b→反向。綜上，要使得變換後的向量M與原向量x夾角小於90度，即映射回原來的向量時保持方向不變，那麼就需要特徵值大於0，所以這也是爲什麼正定矩陣的特徵值都大於0.

參考文章：
https://www.cnblogs.com/marsggbo/p/11461155.html
https://blog.csdn.net/promisejia/article/details/81241201

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【深度學習】梳理凸優化問題（五）

文章目錄

約束優化問題

凸函數

凸優化問題

凸二次規劃問題

額外補充

正定和半正定矩陣

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

【深度學習】梳理凸優化問題（五）

【深度學習】前向傳播和反向傳播（四）

【深度學習】梳理範數與正則化（二）

【深度學習】深度學習概念的理解（一）

tensorflow學習筆記（二）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結