Bregman Iteration

對於搞圖像處理的人而言，不懂變分法，基本上，就沒法讀懂圖像處理的一些經典文獻。當然，這已經是10年之前的事情了。

現在，如果不懂得Bregman迭代算法，也就沒法讀懂最近幾年以來發表的圖像處理的前沿論文了。國內的參考文獻，基本上都是直接引用Bregman迭代算法本身，而對於其原理基本上找不到較爲詳細的論述。本文簡要敘述當前流行的Bregman迭代算法的一些原理。

1. 簡介

近年來，由於壓縮感知的引入，L1正則化優化問題引起人們廣泛的關注。壓縮感知，允許通過少量的數據就可以重建圖像信號。L1正則化問題是凸優化中的經典課題，用傳統的方法難以求解。我們先從經典的圖像復原問題引入：

在圖像復原中，一種通用的模型可以描述如下：

我們目標是從觀測到的圖像f，尋找未知的真實圖像u，u是n維向量空間中的元素，f是m維向量空間中的元素。f 在壓縮感知的術語叫做測量信號。是高斯白噪聲其方差爲sigma^2。A是線性算子，例如反捲積問題中的卷積算子，壓縮感知中則是子採樣測量算子。

上述方程中，我們僅僅知道f，其它變量都不知道的。而且這種問題通常情況都是病態的，通過引入正則項可以使之成爲良態的。正則化方法假定對未知的參數u引入一個先驗的假設，例如稀疏性，平滑性。正則化問題的常見方法Tikhonov方法，它通過求解下面的優化問題：

其中mu是一個大於零的標量，事先設定的常數，用於權衡觀測圖像f和正則項之間的平衡。雙絕對值符號是L2範數。

下面，爲了引入Bregman迭代算法，需要對兩個重要的概念進行描述。

2. Bregman距離

注意這個定義，它是對泛函J在u點的subgradient的定義，p點是其對偶空間的中的某一點。subgradient可以翻譯爲次梯度，子梯度，弱梯度等。等式左邊最右邊一項是內積運算。如果泛函J是簡單的一元函數，則就是兩個實數相乘。次梯度有什麼好處呢？對於一般的導數定義，例如y=|x|在0點是不可導的，但是對於次梯度，它是存在的。

上面的這個定義就是Bregman距離的定義。對於凸函數兩個點u，v之間的Bregman距離，等於其函數值之差，再減去其次梯度點p與自變量之差的內積。要注意的是這個距離不滿足對稱性，這和一般的泛函分析中距離定義是不一樣的。

3. Bregman迭代算法

Bregman迭代算法可以高效的求解下面的泛函的最小

上式中的第一項J，定義爲從X到R的泛函，其定義域X是凸集也是閉集。第二項H，定義爲從X到R的非負可微泛函，f是已知量，並且通常是一個觀測圖像的數據，所以f是矩陣或者向量。上述泛函會根據具體問題的不同具有不同的具體表達式。例如，對於簡介中的圖像復原啊問題，J(u)就是平滑先驗約束，是正則化項；而H則是數據項。

Bregman迭代算法首先是初始化相關的參數爲零，再迭代公式u，其左邊一項是泛函J的Bregman距離。再來看p點的迭代公式，其最右邊一項是泛函H的梯度。

其迭代一次產生的輸出是公式3.2，經過多次的迭代，就能夠收斂到真實的最優解。這個證明過程可以參考後面的文獻。

對於具體的問題，泛函3.1定義的具體形式是不同的。例如對於壓縮感知使用的基追蹤算法，J是L1範數。而對於圖像去噪問題，可能就是u的梯度L1範數，同時A也變成了恆等算子了。

4. 線性Bregman迭代算法

Bregman 迭代算法的每一步迭代都要求解泛函4.1的最小值，這一步的計算代價是很高的。線性Bregman迭代的思路是對泛函4.1的第二項進行線性展開，根據矩陣函數的泰勒公式，泛函4.1的第二項可以展開爲上面4.2的形式。

注意，上述公式4.2省略了泰勒公式中二次項。把二次項加上，帶入前面基本的Bregman迭代算法公式的第一步，我們得到公式4.3。如果我們計算4.3和4.4中間那個表達式，比較其相同項，很容易得到公式4.4.

如果我們考慮基追蹤算法，則H等於 ||Au - f||^2 /2, 將H的導數帶入公式4.4,我們得到公式4.5, 公式4.6是基本Bregman迭代算法的第二步，注意上述4.6公式中u的上標是錯的，應該改爲 k+1 ，這樣纔可能得到公式4.7，公式4.8，4.9, 4.10, 4.11都是顯而易見的。

下面我們把4.11和前面定義的Bregman距離帶入到4.5裏面去,具體如下：