- 方向導數
函數 在 處,方向 的方向導數:
當方向導數 關於 線性的,即,那麼我們稱 在 這一點 Gâteaux differentive,並且
導數.。
- 次梯度與次微分
令 是一個凸的且合適的函數,即 (域空間非空),在 , 如果 滿足,對任意,
就說 是 在 這一點的次梯度 。
例1,對於 , 在 0 這一點:
,
容易求得:, 因此這個集合中的任一點都是這一點的次梯度,這個集合就叫次微分。
例2,對於 = ,在 0 這一點,
, ,
可以看出對於光滑的函數,次梯度就等於通常意義上的梯度。
- 次梯度應用
次梯度有如下重要性質:
對於任何凸且合適的函數 ,點 是 的極值點,當且僅當滿足條件 , 即 0 要是函數在這一點的次梯度。
例1: proximal mapping
,
1. 當; while
2. 當 while ;
3. 當;while ;
- 矩陣範數次微分
令 是矩陣範數,如果 是 維實矩陣,那麼 的次微分被如下定義:
可以看到和函數次微分的定義本質上是一樣的。
在這裏主要考慮正交不變範數,即 , 是正交的。對於這一類範數,可以通過它的奇異值來定義。對A
做奇異值分解,,奇異值按降序排列,,所有這一類範數可以定義成奇異值的函數,,
。例如當 是 norm,可以得到 。當p=1,定義了核範數;當p=2,定義了Frobenius 範數;當
p=,最大奇異值,定義了譜範數,等等。對於這一類通過奇異值定義的範數,有如下定理:
Theorem 1. 方向導數
令 A,R 均爲 的矩陣,對A 做奇異值分解,則A 的方向導數爲:
均是相對於 的奇異向量。
Theorem 2. 次微分
令D 是 的對角矩陣,則矩陣 A 的範數的次微分爲:
D是對角矩陣,對角元素是 的次梯度。conv是集合的convex hull, 即集合中元素的凸組合,對於一個矩陣來說,做奇異值分解時奇異值是唯一的,但奇異向量矩陣U和V不唯一。上式中,次微分中的任一元素 ,即次梯度,可以表示爲:
,
例1. 核範數 。
對A做奇異值分解,,當 A 有s個0奇異值時,。那麼對角矩陣的前 n-s個對角元素爲1,後s個元素的絕對值小於等於1.將劃分成 ,劃分成 , 有n-s個列。
讓, 然後
其中,, , 是對角矩陣,對角元素是 的次梯度。
由於不同奇異向量相差一個正交矩陣,因此,
這裏 分別是n-s,m-n+s,s維的正交矩陣。 是維的對角矩陣,表示矩陣最大奇異值。
最後,可以得到: