[圖像處理]圖像處理中不適定問題(ill posedproblem)或稱爲反問題(inverseProblem)

圖像處理中不適定問題(ill posedproblem)或稱爲反問題(inverseProblem)

法國數學家阿達馬早在19世紀就提出了不適定問題的概念:

稱一個數學、物理定解問題的解存在、唯一併且穩定的則稱該問題是適定的(Well-Posed).如果不滿足適定性概念中的上述判據中的一條或幾條,稱該問題是不適定的。

典型的圖像處理不適定問題包括:

圖像去噪(ImageDe-nosing),圖像恢復(Image Restorsion),圖像放大(Image Zooming),圖像修補(ImageInpainting),圖像去馬賽克(image Demosaicing),圖像超分辨(Image super-resolution)等

1-由於圖像處理中的反問題(inverse)往往是不適定的。解決不適定性的有效途徑是在圖像處理中引入關於圖像的先驗信息。因此圖像的先驗模型對於圖像反問題和其它計算機視覺還是圖像處理問題至關重要。

研究者們從多個角度進行研究,其代表主要有“統計方法”和“正則化幾何建模方法”,“稀疏表示方法”三種主流方法,而最近興起的圖像形態分量分析(MCA)方法

1.1正則化幾何模型

日新月異關於自然圖像建模的“正則化幾何方法”是最近幾年熱點討論的主題。

其中一類方法是利用偏微分方程理論建立圖像處理模型,目前的發展趨勢是從有選擇性非線性擴散的角度設計各類低階、高階或者低階與高階綜合的偏微分方程,或者從實擴散向復擴散推廣,從空域向空頻域相結合以及不同奇異性結構的綜合處理[1]。

另一類方法是基於能量泛函最優的變分方法。1992年,Rudin-Osher-Fatemi提出圖像能被分解爲一個屬於有界變差空間的分量和一個屬於 的分量 的全變差模型[2]。根據國際上及本人的研究表明:ROF模型模型較好地刻畫了圖像中視覺重要邊緣結構,但不能描述紋理信息。2001年Meyer提出了振盪模式分解理論[2]:他認爲振盪分量可以表示爲某個向量函數的散度形式,而振盪分量可以屬於3個可能的函數空間。首先引入有界變差(bounded variational , BV)空間的一個近似對偶空間來表徵圖像的振盪分量;Meyer進一步指出John-Nirenberg的有界均值振盪空間和齊性Besov空間都是振盪分量比較合適的函數空間,由此導出了將圖像分解的(BV,G)模型,(BV,F)模型和(BV,E)模型。Meyer從理論上基本解決了振盪分量的理論框架,成爲紋理等振盪模式分解的奠基性工作,但是原始模型比較難計算。後來的學者大都在Meyer工作的基礎上展開工作。Vese-Osher提出將振盪分量建模爲的向量場的散度來逼近(BV,G)模型[3],實質上是將G空間近似爲負Soblev空間[4]。L.Lieu和L.Vese進一步推廣到分數階負Soblev空間[5]。Aujol,Chamboll等人定義了G-空間中的一個子空間,並根據Chamboll早期提出的ROF模型的投影算法的基礎上,提出圖像的振盪分量是在該子空間上的投影分量,由此提出了著名的BV空間半範+ G空間範數 + L2 範數約束優化的A2BC模型及子空間投影算法 [6-7]。J.B.Garnet,T.M.Le,Y.Meyer,L.A.Vese提出更一般的齊性Besov空間 來刻畫振盪分量 [8]。最近,J.Aujol,A.Chamboll分別對TV範數、G範數、F範數、E範數,L 2範數對圖像的卡通圖像、紋理分量、高斯噪聲進行數理統計和相關性分析,提出了分別運用TV範數、G範數和E範數分別來約束圖像的卡通分量、紋理分量和噪聲分量的三分量圖像分解模型[9]。2007年,G.Gilboa和S.Osher受提出了非局部化G-空間的概念,並概括性的初步提出了非局部ROF模型、非局部Meyer模型、非局部ROF+L1模型[10],從理論上提供了圖像先驗模型研究的新思路。但綜合目前研究來看,變分方法的主要不足是對於紋理和噪聲的刻畫還不夠精細。

1.2 稀疏表示方興未艾

圖像的稀疏表示問題最早源於“有效編碼假說”。Attneave最先提出:視覺感知的目標就是產生一個外部輸入信號的有效表示。在神經生物學領域Barlow基於信息論提出了“有效編碼假設”,**認爲初級視皮層神經細胞的主要功能就是去除輸入刺激的統計相關性[**11]。“有效編碼假設”被提出以後,很多研究人員根據它的思想提出了不同的理論。主要思路分爲兩大類。

直接方法是機理測試方法,即從生物機理上,在自然圖像刺激條件下檢測神經細胞的響應特性。著名的工作如:2001年在《Nature》上發表的研究結果表明,在冗餘性測度和自然刺激條件下一組視網膜神經節對外界刺激獨立編碼[12];2000年在《Science》上發表了類似的成果[13]:通過記錄短尾猿V1 區神經細胞在開放的自然場景和模擬自然場景條件下的神經細胞響應,驗證了視皮層(V1區)神經細胞用稀疏編碼有效表示自然場景,稀疏編碼用最小冗餘度傳遞信息。

另外一個替代的方法是模型仿真方法,即利用自然圖像的統計特性,建立模型模擬早期視覺處理系統的處理機制。例如Olshausen和 Field[14]提出了稀疏編碼模型,稀疏編碼理論表明,通過尋找自然圖像的稀疏編碼表示,該神經網絡可以學習得到類似於簡單細胞感受野的結構。Bell提出了基於信息最大化的無監督算法,通過度量“因子”的聯合信息熵並且使之最大化,擴展了獨立成分分析(ICA)方法,成功地構建有效編碼模型並得到了與上面類似的結果[15]。Hyvarinen更進一步,應用一個兩層的稀疏編碼模型構造出類似於複雜細胞響應特性的基函數,而且基函數集合形成一個有規律的拓撲結構[16]。這部分表明有效編碼假設也可適用於視覺系統高級區域神經細胞的處理過程。

目前關於圖像稀疏表示系統的研究大體上沿着兩條主線展開。

其中一條是沿着多尺度幾何分析理論。研究者認爲圖像的非平穩性和非高斯性,很難用線性算法進行處理,而應該建立合適的能夠處理邊緣到紋理各層面幾何結構的圖像模型;二維圖像中的性狀奇異性邊緣和3-D圖像中絲狀物(filaments) 和管狀物(tubes)幾何特徵不能被各向同性的“方塊基”(如小波基)表示,而最優或者“最稀疏”的函數表示方法應該由各向異性的“鍥形基”表徵。因此以Ridgelet、Curvelet、Bandlet,Contourlet變換爲代表的多尺度幾何分析[16-22]理論成爲圖像稀疏表示的有效途徑。

圖2.1.1(a)給出了二維可分離小波在不同分辨率下逼近曲線的過程,隨着分辨率升高,尺度變細,最終表現爲使用衆多的“點”來逼近曲線。與小波相比,contourlet不僅具有小波的多分辨率特性和時頻局部化特性,還具有很好的方向性和各向異性,即在尺度j時,小波基的支撐域邊長近似爲,而Contourlet的在該尺度下的基函數支撐域的縱橫比可以任意選擇。圖2.1.1(b)爲用Contourlet基函數的支撐域來逼近曲線的過程,由於它的基函數的支撐域表現爲“長方形”,因而是一種更爲有效稀疏的表示法。與二維可分離小波基函數的方向支撐域的各向同性不同,Contourlet基的“長方形”支撐域表現出來的是各向異性(anisotropy)的特點

上述稀疏表示方法都是採用“單一基”,另外一條圖像稀疏表示的途徑是:基函數被稱之爲原子庫的過完備的冗餘系統取代

Mallat和Zhang於1993年首先提出了信號在過完備庫(over-completedictionary)上分解的思想[23].通過信號在過完備庫上的分解,用來表示信號的基可自適應地根據信號本身的特點靈活選取以得到信號非常稀疏的表示.後來人們提出了諸如基追蹤算法、匹配追蹤算法(MP)、正交匹配追蹤算法(OMP)、混合匹配追蹤算法(HMP)及許多變種。涉及的原子包括多尺度Gabor函數,各向異性的精細原子,小波和正弦函數的級聯[24-15]等,並通過訓練方法獲得結構和紋理分量稀疏表示字典[26-28]。目前圖像稀疏表示的研究也引起國內衆多研究者的關注。中科院楊謙、汪雲九等人,中科院計算所史忠植研究員,西安電子科技大學的焦李成教授、華南理工大學謝勝利教授,西南交通大學尹忠科教授等,南京理工大學韋志輝教授,肖亮博士等紛紛展開了稀疏表示的相關問題的研究。目前圖像稀疏表示的研究成爲近3年國內衆多研究者關注的熱點問題,根據<<中國期刊全文數據庫>>的檢索來看,在2004年之前幾乎沒有相關報道,而從2004年1月至2008年2月,中國期刊發表的圖像稀疏表示與多尺度幾和分析應用方面的論文達到187篇,其中關於Ridgelet56篇,關於Contourlet 63篇,關於 Curvelet34篇,關於過完備稀疏表示34篇。西安電子科技大學的焦李成教授、華南理工大學謝勝利教授,西安交通大學尹忠科教授、國防科技大學王正明、教授及課題組成員等紛紛展開了基於稀疏表示的相關應用問題的研究[29-33]。本文作者在基於多尺度幾何分析的圖像增強、去噪、融合、邊緣檢測、感知壓縮和數字水印等展開了相關應用研究,研究結果表明,基於稀疏表示的形態分量分解理論能夠很好的捕獲圖像的幾何特徵,在圖像建模和處理方面具有先天優勢。但是綜觀國內的這些研究還與國外原創性成果具有很大差距。特別在稀疏表示字典的構造、高效稀疏分解算法、稀疏性重建等層面均有大量工作可做。

1.3 形態分量分析暫露頭角

MCA方法是國際著名學者J.-L. Starck, M. Elad, D.L. Donoho在2004年提出的一種將圖像分解爲“幾何結構”、“紋理”、“噪聲”的形態分量分解方法[34]。該方法與混疊信號盲分離在本質上近乎相同,和獨立分量分析(ICA)具有緊密聯繫。在MCA提出之前,圖像分解的研究如火如荼。主要包括“基於稀疏表示的圖像分解”和“基於變分方法的圖像分解”。MCA方法較好的結合了變分方法和稀疏表示方法兩類圖像分解的優點,爲不適定圖像處理問題提供了良好的處理機制。首先從關於圖像形態分量分解的變分方法來看,國際上研究的研究朝着對圖像結構和紋理等形態成分刻畫更精細、計算更簡單的方向發展。圖像分解的(BV,G)模型,(BV,F)模型和(BV,E)模型在本質上就是一種形態分量分析方法。與基於變分方法的圖像分解處理思路不同,J.L.Stack,M.Elad和D.L.Donoho的MCA框架中,一個重要的假設是圖像的幾何結構和紋理分量在某個特定的基庫或過完備子字典下是類內稀疏的,而各形態分量稀疏表示的基庫或過完備子字典之間具有不相干性。通過關於結構分量和紋理分量的分類稀疏表示稀疏的強稀疏性(l0範數或l1範數度量)達到圖像形態分量的有效分離。由於目前所涉及的稀疏表示系統有三類:正交系統(如DCT,DWT);冗餘系統(如Curvelet,Contoulet);過完備字典(如AR-Gauss混合字典)。隨着稀疏表示理論的發展,通過不同的分類稀疏表示字典、稀疏性度量和正則化方法,可以導出不同的圖像形態分量分析算法[35]。之後學者們對MCA中形態成分稀疏性和多樣性[36]、自適應投影閾值選取[37]等問題作了研究,並推廣到多通道情形[38]。

1.4 統計模型經久不衰

關於自然圖像“統計建模方法”的研究由來已久。早期的研究工作,很大程度上受DavidField在20世紀80年代中期的一個重要發現所推動:自然圖像的濾波器響應總是呈現出較大的峯度的統計性質[39]。經典小波分析之所以在信號和圖像處理中取得重大成功,一個比較重要的因素是對小波變換域統計模型的研究取得重大進展,主要包括小波域的MRF模型,小波域隱馬爾科夫模型和分層隱馬爾科夫模型等。隨着多尺度幾何分析的興起,人們對於Ridgelet、Curvelet、Bandlet,Contourlet變換域的統計模型相當關注。事實上,稀疏表示係數的直方圖的峯度要遠遠大於3,呈現明顯的非高斯性,這表明非高斯性蘊含圖像的本質特性。例如,對Cameraman圖像的Contourlet係數進行分析。觀察上面的分佈可以發現,Contourlet係數呈現明顯的重尾分佈。考察直方圖的峯度(Kurtosis)經計算,峯度值遠遠大於典型的高斯分佈Kurtosis值(大約爲3)。許多單變量先驗模型比如廣義高斯模型、學生t-distribution模型已經被成功地用於自然圖像的小波係數的這種非高斯統計特性。最近,學者們開始關注自然圖像濾波器響應的聯合統計行爲。ZhuS.C較爲全面的論述了自然圖像視覺模式的四種主流的統計研究方法,並從信號的稀疏表示出發論述了包括多個Markov隨機場模型及其變種[40]。焦李成等比較研究了多尺度變換域包括隱馬爾科夫樹(HMT)、背景隱馬爾科夫模型(CHMM)等在內的10種統計模型[41]。基於形態分量分析的圖像超分辨重建理論與算法 超分辨率重建(super-resolution reconstruction)是一種由一序列低分辨率退化圖像重建一幅(或序列)高分辨率清晰圖像的第二代復原技術[1]。超分辨率重建技術綜合考慮成像過程中諸如運動變形、光學模糊、低採樣率、隨機噪聲等等各種退化因素,在航空成像、遙感成像、醫學成像、層析成像等衆多領域具有廣泛應用前景。從數學的角度看,圖像超分辨率重建是Hardmard意義下的非適定數學反問題,因此成爲圖像處理、計算機視覺和計算調和分析等多學科領域國際上衆多研究者關注的熱點問題。迄今爲止,人們已經提出圖像超分辨率重建的許多算法。但是如何進一步刻畫圖像的邊緣結構、紋理等圖像中重要視覺特徵,提高圖像超分辨算法對圖像不同視覺特徵的保持能力,解決超分辨問題的不適定性有待深入研究。

圖像超分辨是包含圖像去噪、去模糊、去馬賽克、圖像放大等的組合問題,圖像形態分量分析(MCA-Morphological Component Analysis)通過結合圖像的稀疏表示(Sparcerepresentation)理論和變分方法進行圖像分解,在圖像超分辨應用中具有潛在優勢:

1)MCA通過分類稀疏表示字典將圖像分解爲“幾何結構分量”、“振盪或紋理分量”、“噪聲分量”,提供了良好的圖像結構、紋理自適應處理和噪聲分離機制;

2)MCA繼承了過完備稀疏表示與信號重建的優異性能,能夠以最少的原子捕獲圖像中的高維奇異性特徵。而這種捕獲和跟蹤機制是旋轉、平移和伸縮不變的,因此對於超分辨重建的運動變形、光學模糊,低採樣率的處理非常方便;

3)MCA在稀疏表示的基礎上,繼承了圖像幾何正則化變分方法的優點,理論上爲圖像超分辨提供統一的變分框架。因此MCA理論爲圖像超分辨率復原提供了新的契機和研究思路。基於上述學術思想,本項目旨在通過不同基函數系統或過完備字典對圖像形態分量的統計不相干性和稀疏性的研究,建立符合類內強稀疏而類間強不相干的幾何結構和紋理分量稀疏表示子字典,提出更廣義MCA框架下的稀疏性度量、非局部結構正則化和噪聲先驗度量模型,並在凸分析和穩健統計學思想下,提出MCA框架下聯合處理圖像放大、去噪、去模糊、去馬賽克效應的超分辨重建模型,通過子空間投影和迭代收縮方法提出超分辨率重建的多步迭代算法。本項目對於推動超分辯重建、圖像理解、稀疏表示理論等發展都有重要意義。

1.3亟待解決的科學問題

儘管,當今圖像聯合“變分方法”和“稀疏表示方法”的MCA在圖像處理等方面的研究在不斷深入,但應用於圖像超分辨率重建尚存在着理論和算法上具有挑戰性的問題,主要在於:

◇如何建立不同基庫或過完備字典對圖像形態分量的稀疏性先驗度量,選擇在類內強稀疏、而類間強不相干的形態分量稀疏表示字典?

◇如何建立具有上下文結構的正則化幾何先驗和噪聲模型,提高超分辨重建中噪聲抑制和邊緣結構保持能力?

◇如何有效地結合“變分方法”和“稀疏表示”方法的幾何結構捕獲能力,設計更爲高效的超分辨率重建的約束優化模型?

◇如何針對MCA框架的約束優化超分辨重建模型,設計快速、穩定和收斂的實用算法?

目前,人們已經對MCA方法解決圖像處理問題的挑戰性有了一定的認識,已經在這方面作了初步理論和應用研究,但是這些研究還有待深入。因此本項目將從上述四點挑戰性問題出發,展開相關研究,有望在這些方面取得突破性進展。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章