雙邊濾波(Bilateral filter)
雙邊濾波(Bilateral filter)是一種可以保邊去噪的濾波器。其輸出像素的值依賴於鄰域像素的值的加權組合,即:
也就是:
其中,
這裏的由於和像素值的差有關(像素差越大,權重越小),也被叫做“值域核”。
從效果來說,雙邊濾波可產生類似美膚的效果。皮膚上的皺紋和斑,與正常皮膚的差異,遠小於黑白眼珠之間的差異,因此前者被平滑,而後者被保留。
爲了體現效果,這裏來張大叔的照片。
Steerable濾波
高斯濾波是一種各向同性濾波,如果想要對特定方向進行濾波的話,可使用Steerable濾波。
對最簡二維高斯函數求1階偏導可得:
這就是兩個軸向上的1階Steerable濾波函數。
任意角度的1階Steerable濾波函數爲:
如果對高斯函數求2階偏導,還可得到2階Steerable濾波函數。進一步的討論詳見參考論文。
參考:
1991年IEEE論文:The Design and Use of Steerable Filters
作者:William T. Freeman,斯坦福大學本科+斯坦福/康奈爾大學雙料碩士+麻省理工學院博士,麻省理工學院教授。1987年,曾做爲訪問學者在太原理工大學待了一學年。
Edward H. Adelson,密歇根大學博士,麻省理工學院教授。
Gabor濾波
基、線性無關、正交
一般的函數可以展開爲冪級數或者Fourier級數。這些級數中的冪函數或者正弦函數,被稱作“基(basis)函數”。
基的屬性主要涉及“線性無關”和“正交”這兩個名詞。
線性無關的幾何含義:在(3維空間)中,如果三個向量不共面,則它們相互線性無關。
基如果線性無關,則其函數的級數展開式是唯一的。由於線性相關基使用的比較少,以下如無特指,基均爲線性無關基。
正交的幾何含義:兩個向量正交,則它們是相互垂直的。
正交基一定線性無關,反之則不成立。一般採用施密特正交化方法,將線性無關基,轉換爲正交基。
冪級數是線性無關基,而Fourier級數是正交基。
Gabor wavelet
除了以上兩種常用的基函數外,其他函數也可以作爲基函數。其中使用最多的基函數是小波(wavelet)函數,其變換也被稱作小波變換。
需要指出的是,小波函數不是一個函數,而是一類函數。Gabor函數就是小波函數的其中一種,其定義如下:
這裏的爲常數,爲(立方可積函數),且。
注:Dennis Gabor(1900~1979),全息學創始人,1971年獲諾貝爾物理學獎,著有《Theory of Communication》(1946)。
當爲高斯函數時,可得到Gabor wavelet:
Gabor wavelet的性質:
1.Gabor wavelet的Fourier變換還是Gabor wavelet:
2.從物理上來說,Gabor wavelet等效於在一個正弦載波(頻域)上,調製一個高斯函數(時空域)。這也是Dennis Gabor最早提出它的時候的用途。
3.Fourier變換是信號在整個時域內的積分,因此反映的是信號頻率的統計特性,沒有局部化分析信號的功能。而Gabor變換是一種短時Fourier變換,具有良好的時頻局部化特性,即非常容易地調整Gabor濾波器的方向、基頻帶寬及中心頻率,從而能夠最好的兼顧信號在時空域和頻域中的分辨能力。
Gabor filter
將Gabor wavelet擴展到2維,可得到Gabor filter(圖像實際上就是一種2維信號):
其中,
:正弦函數波長;:Gabor核函數的方向;:相位偏移;:高斯函數的標準差;: 空間的寬高比。
可以看出Gabor filter是一個複函數,其實部爲:
其虛部爲:
此外,還有對數Gabor函數:
Gabor濾波的效果
參考文獻3,給出了Gabor濾波的效果圖,如下所示:
從效果來看,該濾波可獲得美術上的浮雕效果。但實際上,大多數的邊緣檢測算法都可得到類似效果,這並不是Gabor濾波的主流用法。
以下對參考文獻3做一個補充說明:
1.Gabor濾波是複數域的,這點和之前提到的濾波算法有很大的不同。因此,Gabor濾波計算核的方法有3種:複數、實部和虛部。參考文獻3採用的是實部法。1987年,J.P. Jones和L.A. Palmer發現Gabor變換所採用的核(Kernels)的實部與哺乳動物視覺皮層簡單細胞2D感受野剖面(Profile)非常相似。
2.實部計算的結果有正有負。參考文獻3給出的歸一化算法,很有通用性,摘錄如下:
其中,F爲源圖像所有像素的集合,D爲總的灰度級數。
Gabor濾波採樣方式與圖像壓縮
Gabor濾波和之前的濾波算法的另一大差異是:Gabor濾波核不是一個,而是由若干不同參數組合而成的一組核,其中的每一個參數組合被稱爲一個採樣點。
從Gabor filter的計算公式亦可看出,組成採樣點的參數,既有時空域參數,也有頻域參數。這些採樣點在時空域和頻域中如何分佈,才能達到最終效果呢?
由於Gabor filter不是正交基,因此針對採樣點分佈提出了Tight Frame的概念。參考文獻1給出了滿足Tight Frame要求的採樣點分佈方式(簡稱採樣方式)的條件。這裏的推導非常複雜,但從概念上可以類比信號處理中的奈奎斯特採樣定理。
Tight Frame有個重要特性:
如果採樣方式滿足Tight Frame條件,且圖像集B=Gabor(圖像A),圖像C=Gabor−1(圖像集B)分別表示Gabor變換及其逆變換。
參考文獻2給出了採用上述方法對Lena圖進行壓縮並還原的例子。這也是Gabor濾波在圖像處理領域的早期典型應用。
Gabor濾波與模式識別
2000年以後,科學界對Gabor濾波的研究,主要集中在模式識別方面。比如圖2就是參考文獻4中給出的人臉識別方面的Gabor濾波效果圖。其中,左邊是原圖,而右邊是40組不同參數的Gabor濾波器所得到的濾波效果圖。
注:1幅原圖變成40幅濾波效果圖的過程,在數學上是個升維過程。在後處理階段爲了處理的方便,往往會進行數據降維,如參考文獻5所示。
從中還可以看出,雖然圖1顯示出一定的藝術處理效果,但大多數情況下,Gabor濾波所得的圖像是如圖2所示的極度扭曲而無明顯意義的圖片。Gabor濾波的真正用途,並不是給人看,而是給機器看。
從上面的討論可知,Gabor濾波是一種帶通濾波,使用不同的時空域或頻域參數,可以過濾出不同的時空域或頻域特徵。這些特徵正是模式識別所需要的。
圖3是參考文獻4給出的一種Gabor濾波器的使用場景圖,從中可以看出Gabor濾波效果圖是如何應用到人臉識別技術中的。
必須指出的是:Gabor濾波效果圖的後處理方法有很多種,而圖3僅是其中一種而已。
參考
1.1996年IEEE論文:Image Representation Using 2D Gabor Wavelets
作者:Tai Sing Lee,哈佛大學博士,卡內基梅隆大學教授。
2.1988年IEEE論文:Complete Discrete 2-D Gabor Transforms by Neural Networks for Image Analysis and Compression
作者:JohnG. Daugman,哈佛大學博士,劍橋大學教授。
3.http://blog.csdn.net/xiaowei_cqu/article/details/24745945
4.Face recognition using Ada-Boosted Gabor features
作者:Peng Yang,Shiguang Shan,Wen Gao,Stan Z. Li,Dong Zhang,中科院計算所和微軟亞洲研究院的幾個小牛。
5.http://www.cnblogs.com/Jack-Lee/p/3649114.html
Schmid濾波
Schmid濾波器是一種類Gabor濾波器。其計算公式爲:
下圖是Schmid濾波器和Gabor濾波器的“核”圖像。“核”圖像是濾波器“核”函數的圖像化展示。
其中,前13個是Schmid濾波器,後8個是Gabor濾波器。“核”圖像中的白色部分,實際上就是該濾波器的帶通部分。
從中可以看出,Gabor濾波器有方向性,而Schmid濾波器是各向同性的。
參考
2010年IEEE論文:Constructing models for content-based image retrieval
作者:Cordelia Schmid,女,卡爾斯魯厄理工學院博士。現在INRIA(法國國家信息與自動化研究所)從事研究工作。
轉載至: