壓縮感知通俗解釋

        壓縮感知從字面上看起來,好像是數據壓縮的意思,而實則出於完全不同的考慮。經典的數據壓縮技術,無論是音頻壓縮(例如 mp3),圖像壓縮(例如 jpeg),視頻壓縮(mpeg),還是一般的編碼壓縮(zip),都是從數據本身的特性出發,尋找並剔除數據中隱含的冗餘度,從而達到壓縮的目的。這樣的壓縮有兩個特點:第一、它是發生在數據已經被完整採集到之後;第二、它本身需要複雜的算法來完成。相較而言,解碼過程反而一般來說在計算上比較簡單,以音頻壓縮爲例,壓制一個 mp3 文件的計算量遠大於播放(即解壓縮)一個 mp3 文件的計算量。稍加思量就會發現,這種壓縮和解壓縮的不對稱性正好同人們的需求是相反的。在大多數情況下,採集並處理數據的設備,往往是廉價、省電、計算能力較低的便攜設備,例如傻瓜相機、或者錄音筆、或者遙控監視器等等。而負責處理(即解壓縮)信息的過程卻反而往往在大型計算機上進行,它有更高的計算能力,也常常沒有便攜和省電的要求。也就是說,我們是在用廉價節能的設備來處理複雜的計算任務,而用大型高效的設備處理相對簡單的計算任務。這一矛盾在某些情況下甚至會更爲尖銳,例如在野外作業或者軍事作業的場合,採集數據的設備往往曝露在自然環境之中,隨時可能失去能源供給或者甚至部分喪失性能,在這種情況下,傳統的數據採集-壓縮-傳輸-解壓縮的模式就基本上失效了。
       壓縮感知的概念就是爲了解決這樣的矛盾而產生的。既然採集數據之後反正要壓縮掉其中的冗餘度,而這個壓縮過程又相對來說比較困難,那麼我們爲什麼不直接「採集」壓縮後的數據?這樣採集的任務要輕得多,而且還省去了壓縮的麻煩。這就是所謂的「壓縮感知」,也就是說,直接感知壓縮了的信息。可是這看起來是不可能的事情。因爲壓縮後的數據並不是壓縮前的數據的一個子集,並不是說,本來有照相機的感光器上有一千萬個像素,扔掉其中八百萬個,剩下的兩百萬個採集到的就是壓縮後的圖像,──這樣只能採集到不完整的一小塊圖像,有些信息被永遠的丟失了而且不可能被恢復。如果要想採集很少一部分數據並且指望從這些少量數據中「解壓縮」出大量信息,就需要保證:第一:這些少量的採集到的數據包含了原信號的全局信息,第二:存在一種算法能夠從這些少量的數據中還原出原先的信息來。
       有趣的是,在某些特定的場合,上述第一件事情是自動得到滿足的。最典型的例子就是醫學圖像成像,例如斷層掃描(CT)技術和核磁共振(MRI)技術。對這兩種技術稍有了解的人都知道,這兩種成像技術中,儀器所採集到的都不是直接的圖像像素,而是圖像經歷過全局傅立葉變換後的數據。也就是說,每一個單獨的數據都在某種程度上包含了全圖像的信息。在這種情況下,去掉一部分採集到的數據並不會導致一部分圖像信息永久的丟失(它們仍舊被包含在其它數據裏)。這正是我們想要的情況。
       上述第二件事就要歸功於陶哲軒和坎戴的工作了。他們的工作指出,如果假定信號(無論是圖像還是聲音還是其他別的種類的信號)滿足某種特定的「稀疏性」,那麼從這些少量的測量數據中,確實有可能還原出原始的較大的信號來,其中所需要的計算部分是一個複雜的迭代優化過程,即所謂的「L1-最小化」算法。
       把上述兩件事情放在一起,我們就能看到這種模式的優點所在。它意味着:我們可以在採集數據的時候只簡單採集一部分數據(「壓縮感知」),然後把複雜的部分交給數據還原的這一端來做,正好匹配了我們期望的格局。在醫學圖像領域裏,這個方案特別有好處,因爲採集數據的過程往往是對病人帶來很大麻煩甚至身體傷害的過程。以 X 光斷層掃描爲例,衆所周知 X 光輻射會對病人造成身體損害,而「壓縮感知」就意味着我們可以用比經典方法少得多的輻射劑量來進行數據採集,這在醫學上的意義是不言而喻的。
       這一思路可以擴展到很多領域。在大量的實際問題中,我們傾向於儘量少地採集數據,或者由於客觀條件所限不得不採集不完整的數據。如果這些數據和我們所希望重建的信息之間有某種全局性的變換關係,並且我們預先知道那些信息滿足某種稀疏性條件,就總可以試着用類似的方式從比較少的數據中還原出比較多的信號來。到今天爲止,這樣的研究已經拓展地非常廣泛了。但是同樣需要說明的是,這樣的做法在不同的應用領域裏並不總能滿足上面所描述的兩個條件。有的時候,第一個條件(也就是說測量到的數據包含信號的全局信息)無法得到滿足,例如最傳統的攝影問題,每個感光元件所感知到的都只是一小塊圖像而不是什麼全局信息,這是由照相機的物理性質決定的。爲了解決這個問題,美國 Rice 大學的一部分科學家正在試圖開發一種新的攝影裝置(被稱爲「單像素照相機」),爭取用盡量少的感光元件實現儘量高分辨率的攝影。有的時候,第二個條件(也就是說有數學方法保證能夠從不完整的數據中還原出信號)無法得到滿足。這種時候,實踐就走在了理論前面。人們已經可以在算法上事先很多數據重建的過程,但是相應的理論分析卻成爲了留在數學家面前的課題。
      但是無論如何,壓縮感知所代表的基本思路:從儘量少的數據中提取儘量多的信息,毫無疑問是一種有着極大理論和應用前景的想法。它是傳統信息論的一個延伸,但是又超越了傳統的壓縮理論,成爲了一門嶄新的子分支。它從誕生之日起到現在不過幾年時間,其影響卻已經席捲了大半個應用科學。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章