MP算法和OMP算法及其思想

主要介紹MP(Matching Pursuits)算法和OMP(Orthogonal Matching Pursuit)算法[1]，這兩個算法雖然在90年代初就提出來了，但作爲經典的算法，國內文獻(可能有我沒有搜索到)都僅描述了算法步驟和簡單的應用，並未對其進行詳盡的分析，國外的文獻還是分析的很透徹，所以我結合自己的理解，來分析一下寫到博客裏，算作筆記。

1. 信號的稀疏表示(sparse representation of signals)

給定一個過完備字典矩陣，其中它的每列表示一種原型信號的原子。給定一個信號y，它可以被表示成這些原子的稀疏線性組合。信號 y 可以被表達爲 y = Dx ，或者。字典矩陣中所謂過完備性，指的是原子的個數遠遠大於信號y的長度(其長度很顯然是n)，即n<<k。

2.MP算法(匹配追蹤算法)

2.1 算法描述

作爲對信號進行稀疏分解的方法之一，將信號在完備字典庫上進行分解。

假定被表示的信號爲y，其長度爲n。假定H表示Hilbert空間，在這個空間H裏，由一組向量構成字典矩陣D，其中每個向量可以稱爲原子(atom)，其長度與被表示信號 y 的長度n相同，而且這些向量已作爲歸一化處理，即|，也就是單位向量長度爲1。MP算法的基本思想：從字典矩陣D（也稱爲過完備原子庫中），選擇一個與信號 y 最匹配的原子(也就是某列)，構建一個稀疏逼近，並求出信號殘差，然後繼續選擇與信號殘差最匹配的原子，反覆迭代，信號y可以由這些原子來線性和，再加上最後的殘差值來表示。很顯然，如果殘差值在可以忽略的範圍內，則信號y就是這些原子的線性組合。如果選擇與信號y最匹配的原子？如何構建稀疏逼近並求殘差？如何進行迭代？我們來詳細介紹使用MP進行信號分解的步驟：[1] 計算信號 y 與字典矩陣中每列(原子)的內積，選擇絕對值最大的一個原子，它就是與信號 y 在本次迭代運算中最匹配的。用專業術語來描述：令信號，從字典矩陣中選擇一個最爲匹配的原子，滿足，r0 表示一個字典矩陣的列索引。這樣，信號 y 就被分解爲在最匹配原子的垂直投影分量和殘值兩部分，即：。[2]對殘值R1f進行步驟[1]同樣的分解，那麼第K步可以得到：

，其中滿足。可見，經過K步分解後，信號 y 被分解爲：，其中。

2.2 繼續討論

(1)爲什麼要假定在Hilbert空間中？Hilbert空間就是定義了完備的內積空。很顯然，MP中的計算使用向量的內積運算，所以在在Hilbert空間中進行信號分解理所當然了。什麼是完備的內積空間？篇幅有限就請自己搜索一下吧。

(2)爲什麼原子要事先被歸一化處理了，即上面的描述。內積常用於計算一個矢量在一個方向上的投影長度，這時方向的矢量必須是單位矢量。MP中選擇最匹配的原子是，是選擇內積最大的一個，也就是信號(或是殘值)在原子(單位的)垂直投影長度最長的一個，比如第一次分解過程中，投影長度就是。，三個向量，構成一個三角形，且和正交（不能說垂直，但是可以想象二維空間這兩個矢量是垂直的）。

(3)MP算法是收斂的，因爲，和正交，由這兩個可以得出，得出每一個殘值比上一次的小，故而收斂。

2.3 MP算法的缺點

如上所述，如果信號(殘值)在已選擇的原子進行垂直投影是非正交性的，這會使得每次迭代的結果並不少最優的而是次最優的，收斂需要很多次迭代。舉個例子說明一下：在二維空間上，有一個信號 y 被 D=[x1, x2]來表達，MP算法迭代會發現總是在x1和x2上反覆迭代，即，這個就是信號(殘值)在已選擇的原子進行垂直投影的非正交性導致的。再用嚴謹的方式描述[1]可能容易理解:在Hilbert空間H中，，，定義，就是它是這些向量的張成中的一個，MP構造一種表達形式：;這裏的Pvf表示 f在V上的一個正交投影操作，那麼MP算法的第 k 次迭代的結果可以表示如下(前面描述時信號爲y，這裏變成f了，請注意)：

如果是最優的k項近似值，當且僅當。由於MP僅能保證，所以一般情況下是次優的。這是什麼意思呢？是k個項的線性表示，這個組合的值作爲近似值，只有在第k個殘差和正交，纔是最優的。如果第k個殘值與正交，意味這個殘值與fk的任意一項都線性無關，那麼第k個殘值在後面的分解過程中，不可能出現fk中已經出現的項，這纔是最優的。而一般情況下，不能滿足這個條件，MP一般只能滿足第k個殘差和xk正交，這也就是前面爲什麼提到“信號(殘值)在已選擇的原子進行垂直投影是非正交性的”的原因。如果第k個殘差和fk不正交，那麼後面的迭代還會出現fk中已經出現的項，很顯然fk就不是最優的，這也就是爲什麼說MP收斂就需要更多次迭代的原因。不是說MP一定得到不到最優解，而且其前面描述的特性導致一般得到不到最優解而是次優解。那麼，有沒有辦法讓第k個殘差與正交，方法是有的，這就是下面要談到的OMP算法。