圖像處理與識別學習小結

 

數字圖像處理 是對圖像進行分析、加工、和處理,使其滿足視覺、心理以及其他要求的技術。圖像處理是信號處理在圖像域上的一個應用。目前大多數的圖像是以數字形式存儲,因而圖像處理很多情況下指數字圖像處理。此外,基於光學理論的處理方法依然佔有重要的地位。 數字圖像處理 是信號處理的子類, 另外與計算機科學、人工智能等領域也有密切的關係。 傳 統的一維信號處理的方法和概念很多仍然可以直接應用在圖像處理上,比如降噪、量化等。然而,圖像屬於二維信號,和一維信號相比,它有自己特殊的一面,處理 的方式和角度也有所不同。大多數用於一維信號處理的概念都有其在二維圖像信號領域的延伸,它們中的一部分在二維情形下變得十分複雜。同時圖像處理也具有自 身一些新的概念,例如,連通性、旋轉不變性,等等。這些概念僅對二維或更高維的情況下才有非平凡的意義。圖像處理中常用到快速傅立葉變換,因爲它可以減小 數據處理量和處理時間。
數字圖像處理 應用在以下方面

攝影及印刷 (Photography and printing)

衛星圖像處理 (Satellite image processing)

醫學圖像處理 (Medical image processing)

面孔識別 , 特徵識別 (Face detection, feature detection, face identification)

顯微圖像處理 (Microscope image processing)

汽車障礙識別 (Car barrier detection)

 

數字圖像基礎

圖像的基本概念、圖像取樣和量化、數字圖像表示、   空間和灰度級分辨率、圖像紋理、像素間的一些基本關係(相鄰像素、鄰接性、連通性、區域和邊界、距離度量)、線性和非線性 變換

線性變換:如果變換函數是線性的或是分段線性,這種變換就是線性變換。以線性函數加大圖像的對比度的效果是使整幅圖像的質量改善。以分段線性函數加大圖像中某個(或某幾個)亮度區間的對比度的效果是使局部亮度區間的質量得到改善。

非線性變換:當變換函數是非線性時,即爲非線性變換。常用的有指數變換和對數變換。

RGB (red green blue): 紅綠藍三基色

CMYK (Cyan-Magenta-Yellow-black inK): 青色 - 品紅 - 黃色 - 黑色

HSI (Hue-Saturation-Intensity): 色調 - 飽和度 - 強度

DDB (device-dependent bitmap): 設備相關位圖

DIB (device-independent bitmap): 設備無關位圖

CVBS (Composite Video Broadcast Signal): 複合電視廣播信號

YUV (亦稱 Y Cr Cb )是被歐洲電視系統所採用的一種顏色編碼方法(屬於 PAL 制)。

 



 

數字圖像存儲與顯示

圖像格式

在計算機中,有兩種類型的圖:矢量圖 (vector graphics) 和位映象圖 (bitmapped graphics) 。矢量圖是用數學方法描述的一系列點、線、弧和其他幾何形狀,如圖 (a) 所示。因此存放這種圖使用的格式稱爲矢量圖格式,存儲的數據主要是繪製圖形的數學描述;位映象圖 (bitmapped graphics) 也稱光柵圖 (raster graphics) ,這種圖就像電視圖像一樣,由象點組成的,如圖 (b) ,因此存放這種圖使用的格式稱爲位映象圖格式,經常簡稱爲位圖格式,存儲的數據是描述像素的數值。

 

矢量圖與位映象圖

目前包括 bmp 格式、 gif 格式、 jpeg 格式、 jpeg2000 格式、 tiff 格式、 psd 格式、

Png 格式、 swf 格式、 svg 格式、 pcx 格式、 dxf 格式、 wmf 格式、 emf 格式、 LIC 格式、 eps 格式、 TGA 格式。

目前比較出名的圖像處理庫有很多,比如 LEADTOOLS OPENCV LEADTOOLS 這個是功能非常強大的圖像多媒體庫,但是這個是收費註冊的。 OpenCV 是一個跨平臺的中、高層 API 構成,目前包括 300 多個 C 函數。它不依賴與其它的外部庫,儘管也可以使用某些外部庫。 OpenCV 對非商業用途和商業用途都是免費( FREE )的。開源的圖像庫也有不少,比如:

ImageStone GIMP CxImage 等,雖然它們的功能沒有 LEADTOOLS 強大,但是一般的圖像處理是可以應付的。

具體的功能介紹參考: http://blog.csdn.net/byxdaz/archive/2009/03/09/3972293.aspx

OpenCV 源代碼及文檔下載: SOURCEFORGE.NET
http://sourceforge.net/projects/opencvlibrary/

 

 

數字圖像增強

圖像增強的目的在於改善圖像的顯示質量,以利於信息的提取和識別。從方法上說,則是設法摒棄一些認爲不必要或干擾的信息,而將所需要的信息得以突出出來,以利於分析判讀或作進一步的處理。以下介紹幾種較爲簡單的遙感數字圖像增強處理方法。

A 空間域增強處理

空 間域是指圖像平面所在的二維空間,空間域圖像增強是指在圖像平面上應用某種數學模型,通過改變圖像像元灰度值達到增強效果,這種增強並不改變像元的位置。 空域增強包括空域變換增強與空域濾波增強兩種。空域變換增強是基於點處理的增強方法、空域濾波增強是基於鄰域處理的增強方法。

1 )、空域變換增強

常用的空域變換增強方法包括:對比度增強、直方圖增強和圖像算術運算等。

對 比度增強是一種通過改變圖像像元的亮度分佈態勢,擴展灰度分佈區間來改變圖像像元對比度,從而改善圖像質量的圖像處理方法。因爲亮度值是輻射強度的反映, 所以也稱爲輻射增強。常用的方法有對比度線性變換和非線性變換。其關鍵是尋找到一個函數,以此函數對圖像中每一個像元進行變換,使像元得到統一的重新分 配,構成得到反差增強的圖像。

直方圖增強

直方圖均衡化

      直方圖均衡化基本做法是將每個灰度區間等概率分佈代替了原來的隨機分佈,即增強後的圖象中每一灰度級的像元數目大致相同。直方圖均衡化可使得面積最大的地物細節得以增強,而面積小的地物與其灰度接近的地物進行合併,形成綜合地物。減少灰度等級換取對比度的增大。

直方圖歸一化  

     直 方圖歸一化是把原圖像的直方圖變換爲某種指定形態的直方圖或某一參考圖像的直方圖,然後按着已知的指定形態的直方圖調整原圖像各像元的灰級,最後得到一個 直方圖匹配的圖像。這種方法主要應用在有一幅很好的圖像作爲標準的情況下,對另一幅不滿意的圖像用標準圖像的直方圖進行匹配處理,以改善被處理圖像的質 量。如在數字鑲嵌時,重疊區影像色調由於時相等原因差異往往很大,利用直方圖匹配這一方法後可以改善重疊區影像色調過度,如果鑲嵌圖像時相相差不大,完全 可以作到無縫鑲嵌。

數字圖像的算術運算

兩幅或多幅單波段影像,完成空間配準後,通過一系列運算,可以實現圖像增強,達到提取某些信息或去掉某些不必要信息的目的。

  

2 )、空域濾波增強

空 域變換增強是按像元逐點運算的,從整體上改善圖像的質量,並不考慮周圍像元影響。空間濾波增強則是以重點突出圖像上的某些特徵爲目的的(如突出邊緣或紋理 等),通過像元與周圍相鄰像元的關係,採取空間域中的鄰域處理方法進行圖像增強。鄰域法處理用於去噪聲、圖像平滑、銳化和相關運算。

圖像卷積運算是在空間域上對圖像作局部檢測的運算,以實現平滑和銳化的目的。具體作法是選定一卷積函數,又稱爲 “M×N 窗口 模板 ,如 3×3 5×5 等。然後從圖像左上角開始開一與模板同樣大小的活動窗口,圖像窗口與模板像元的亮度值對應相乘再相加。將計算結果賦予中心像元作爲其灰度值,然後待移動後重新計算,將計算結果賦予另一箇中心像元,以此類推直到全幅圖像掃描一遍結束生成新的圖像。

平滑是指圖像中出現某些亮度變化過大的區域,或出現不該有的亮點( 噪聲 )時,採用平滑方法可以減小變化,使亮度平緩或去掉不必要 噪聲 點。它實際上是使圖像中高頻成分消退,即平滑圖像的細節,降低其反差,保存低頻成分,在頻域中稱爲低通濾波。具體方法有:均值平滑、中值濾波、銳化。

銳化的作用在於提高邊緣灰度值的變化率,使界線更加清晰。它是增強圖像中的高頻成分,在頻域處理中稱爲高通濾波,也就是使圖像細節的反差提高,也稱邊緣增強。要突出圖像的邊緣、線狀目標或亮度變化率大的部分常採用銳化方法。一般有三種實現方法:

1 )梯度法

    梯 度反映了相鄰像元的亮度變化率,即圖像中如果存在邊緣,如湖泊、河流的邊界,山脈和道路等,則邊緣處有較大的梯度值。對於亮度值較平滑的部分,亮度梯度值 較小。因此,找到梯度較大的位置,也就找到邊緣,然後再用不同的梯度計算值代替邊緣處像元的值,也就突出了邊緣,實現了圖像的銳化。通常有羅伯特梯度和索 伯爾梯度方法。

2 )拉普拉斯算法

    拉普拉斯算法的意義與梯度法不同,它不檢測均勻的亮度變化,而是檢測變化率的變化率,相當於二階微分。計算出的圖像更加突出亮度值突變的位置。

3 )定向檢測

    當有目的地檢測某一方向的邊、線或紋理特徵時,可選擇特定的模板卷積運算作定向檢測。可以檢測垂直邊界、水平邊界和對角線邊界等,各使用的模板不同

 

B 頻率域圖像增強處理
頻域增強指在圖像的頻率域內,對圖像的變換系數(頻率成分)直接進行運算,然後通過 Fourier 逆變換以獲得圖像的增強效果。

一般來說,圖像的邊緣和噪聲對應 Fourier 變換中的高頻部分,所以低通濾波能夠平滑圖像、去除噪聲。

圖像灰度發生聚變的部分與頻譜的高頻分量對應,所以採用高頻濾波器衰減或抑制低頻分量,能夠對圖像進行銳化處理。

頻域,就是由圖像 f(x,y) 的二維傅立葉變換和相應的頻率變量 (u,v ) 的值所組成的空間。在空間域圖像強度的變化模式(或規律)可以直接在該空間得到反應。 F(0,0) 是頻域中的原點,反應圖像的平均灰度級,即圖像中的直流成分;低頻反映圖像灰度發生緩慢變化的部分;而高頻對應圖像中灰度發生更快速變化的部分,如邊緣、噪聲等。但頻域不能反應圖像的空間信息。

 

 

二維 DFT 及其反變換、 Fast FT

關於這方面的內容需要參考數學知識。

空域和頻域濾波間的對應關係:

卷積定理是空域和頻域濾波的最基本聯繫紐帶。二維卷積定理:

 

 

 

 

基本計算過程:

  1. 取函數 h(m,n) 關於原點的鏡像,得到 h(-m,-n)
  2. 對某個 (x,y), 使 h(-m,-n) 移動相應的距離,得到 h(x-m,y-n)
  3. 對積函數 f(m,n)h(x-m,y-n) (m,n) 的取值範圍內求和
  4. 位移是整數增量,對所有的 (x,y) 重複上面的過程,直到兩個函數: f(m,n) h(x-m,y-n) 不再有重疊的部分。

 

傅立葉變換是空域和頻域的橋樑,關於兩個域濾波的傅立葉變換對:

 

 

 

 

 

頻域與空域濾波的比較:

1. 對具有同樣大小的空域和頻率濾波器: h(x,y), H(u,v) ,頻域計算 ( 由於 FFT) 往往更有效 ( 尤其是圖像尺寸比較大時)。但對在空域中用尺寸較小的模板就能解決的問題,則往往在空域中直接操作。

2. 頻域濾波雖然更直接,但如果可以使用較小的濾波器,還是在空域計算爲好。     因爲省去了計算傅立葉變換及反變換等步驟。

3. 由於更多的直觀性,頻率濾波器設計往往作爲空域濾波器設計的嚮導。

 

平滑的頻率域濾波器類型
、理想低通濾波器
、巴特沃思低通濾波器
、高斯低通濾波器
頻率域銳化濾波器類型
理想高通濾波器
巴特沃思高通濾波器

高斯型高通濾波器

頻率域的拉普拉斯算子
鈍化模板、高頻提升濾波和高頻加強濾波
頻率域圖像增強處理的過程:

 

圖像復原
圖像復原:試圖利用退化過程的先驗知識,去恢復已被退化圖像的本來面目。

 

圖像復原的基本思路:先建立退化的數學模型,然後根據該模型對退化圖像進行擬合。

圖像復原模型可以用連續數學和離散數學處理,處理項的實現可在空間域卷積,或在頻域相乘。  
參考資料:
http://download.csdn.net/source/1513324

 


邊緣檢測

數 字圖像的邊緣檢測是圖像分割、目標區域的識別、區域形狀提取等圖像分析領域十分重要的基礎,圖像理解和分析的第一步往往就是邊緣檢測,目前它以成爲機器視 覺研究領域最活躍的課題之一,在工程應用中佔有十分重要的地位。所謂邊緣就是指圖像局部亮度變化最顯著的部分,它是檢測圖像局部變化顯著變化的最基本的運 算。邊緣的記錄有鏈碼錶和線段表 2 種,鏈碼錶適合計算周長,線段表容易計算面積以及相關的,他們之間可以相互的轉換

常見的邊緣檢測算法:

Roberts 邊緣檢測算子

Sobel 邊緣算子

Prewitt 邊緣算子

Kirsch 邊緣算子

CANNY 邊緣檢測

 


圖像壓縮
圖像壓縮 是 數據壓縮技術在數字圖像上的應用,它的目的是減少圖像數據中的冗餘信息從而用更加高效的格式存儲和傳輸數據。圖像壓縮可以是有損數據壓縮也可以是無損數據 壓縮。對於如繪製的技術圖、圖表或者漫畫優先使用無損壓縮,這是因爲有損壓縮方法,尤其是在低的位速條件下將會帶來壓縮失真。如醫療圖像或者用於存檔的掃 描圖像等這些有價值的內容的壓縮也儘量選擇無損壓縮方法。有損方法非常適合於自然的圖像,例如一些應用中圖像的微小損失是可以接受的(有時是無法感知 的),這樣就可以大幅度地減小位速。

無損圖像壓縮方法有:

行程長度編碼

熵編碼法

LZW 算法

有損壓縮方法有:

將色彩空間化減到圖像中常用的顏色。所選擇的顏色定義在壓縮圖像頭的調色板中,圖像中的每個像素都用調色板中顏色索引表示。這種方法可以與 抖動 (en:dithering) 一起使用以模糊顏色邊界。

色度抽樣,這利用了人眼對於亮度變化的敏感性遠大於顏色變化,這樣就可以將圖像中的顏色信息減少一半甚至更多。

變換編碼,這是最常用的方法。首先使用如離散餘弦變換( DCT )或者小波變換這樣的傅立葉相關變換,然後進行量化和用熵編碼法壓縮。

分形壓縮( en:Fractal compression )。



形態學圖像處理
 
膨脹與腐蝕

  膨脹
腐蝕
開操作與閉操作
擊中或擊不中變換
一些基本的形態學算法

邊界提取
區域填充
連通分量的提取
凸殼
細化
粗化
骨架

裁剪


圖像分割
圖像分割是指通過某種方法,使得畫面場景中的目標物被分爲不同的類別。通常圖像分割的實現方法是,將圖像分爲“黑”、“白”兩類,這兩類分別代表了兩個不同的對象。

圖像分割方法: 閾值 分割 區域分割、 數學形態學、模式識別方法

A、閾值 分割包括以下幾種:

1 )由直方圖灰度分佈選擇閾值

2 )雙峯法選擇閾值

3 )迭代法選取閾值

     原理如下,很好理解。

     迭代法是基於逼近的思想,其步驟如下:
      1. 求出圖象的最大灰度值和最小灰度值,分別記爲ZMAX和ZMIN,令初始閾值T0=(ZMAX+ZMIN)/2;
     2. 根據閾值TK將圖象分割爲前景和背景,分別求出兩者的平均灰度值ZO和ZB;
     3. 求出新閾值TK+1=(ZO+ZB)/2;
     4. 若TK=TK+1,則所得即爲閾值;否則轉2,迭代計算。

4 )大津法選擇閾值

大津法是屬於最大類間方差法,它是自適應計算單閾值的簡單高效方法,或者叫( Otsu

大津法由大津於 1979 年提出,對圖像 Image ,記 t 爲前景與背景的分割閾值,前景點數佔圖像比例爲 w0 ,平均灰度爲 u0 ;背景點數佔圖像比例爲 w1 ,平均灰度爲 u1 。圖像的總平均灰度爲: u=w0*u0+w1*u1 。從最小灰度值到最大灰度值遍歷 t ,當 t 使得值 g=w0*(u0-u)2+w1*(u1-u)2 最大時 t 即爲分割的最佳閾值。對大津法可作如下理解:該式實際上就是類間方差值,閾值 t 分割出的前景和背景兩部分構成了整幅圖像,而前景取值 u0 ,概率爲 w0 ,背景取值 u1 ,概率爲 w1 ,總均值爲 u ,根據方差的定義即得該式。因方差是灰度分佈均勻性的一種度量 , 方差值越大 , 說明構成圖像的兩部分差別越大 , 當部分目標錯分爲背景或部分背景錯分爲目標都會導致兩部分差別變小,因此使類間方差最大的分割意味着錯分概率最小。直接應用大津法計算量較大,因此一般採用了等價的公式 g=w0*w1*(u0-u1)2

5 )由灰度拉伸選擇閾值

大 津法是較通用的方法,但是它對兩羣物體在灰度不明顯的情況下會丟失一些整體信息。因此爲了解決這種現象採用灰度拉伸的增強大津法。在大津法的思想上增加灰 度的級數來增強前兩羣物體的灰度差。對於原來的灰度級乘上同一個係數,從而擴大了圖像灰度的級數。試驗結果表明不同的拉伸係數,分割效果差別比較大。

 

B 、區域的分割

區域生長、區域分離與合併

  區域生長算法


C 基於形態學分水嶺的分割

分水嶺分割算法


圖像特徵提取與匹配

常用的圖像特徵有顏色特徵、紋理特徵、形狀特徵、空間關係特徵。

A 顏色特徵

特點:顏色特徵是一種全局特徵 , 描述了圖像或圖像區域所對應的景物的表面性質。一般顏色特徵是基於像素點的特徵,此時所有屬於圖像或圖像區域的像素都有各自的貢獻。由於顏色對圖像或圖像區域的方向、大小等變化不敏感,所以顏色特徵不能很好地捕捉圖像中對象的局部特徵。

常用的特徵提取與匹配方法:

顏色直方圖

其 優點在於:它能簡單描述一幅圖像中顏色的全局分佈,即不同色彩在整幅圖像中所佔的比例,特別適用於描述那些難以自動分割的圖像和不需要考慮物體空間位置的 圖像。其缺點在於:它無法描述圖像中顏色的局部分佈及每種色彩所處的空間位置,即無法描述圖像中的某一具體的對象或物體。

顏色直方圖特徵匹配方法:直方圖相交法、距離法、中心距法、參考顏色表法、累加顏色直方圖法。

 

B 紋理特徵

紋理特徵的提取方法比較簡單,它是用一個活動的窗口在圖像上連續滑動,分別計算出窗口中的方差、均值、最大值、最小值及二者之差和信息熵等,

形成相應的紋理圖像,當目標的光譜特性比較接近時,紋理特徵對於區分目標可以起到積極的作用。選取適當的數據動態變化範圍,進行紋理特徵提取後,使影像的紋理特徵得到突出,有利於提取構造信息。

特 點:紋理特徵也是一種全局特徵,它也描述了圖像或圖像區域所對應景物的表面性質。但由於紋理只是一種物體表面的特性,並不能完全反映出物體的本質屬性,所 以僅僅利用紋理特徵是無法獲得高層次圖像內容的。與顏色特徵不同,紋理特徵不是基於像素點的特徵,它需要在包含多個像素點的區域中進行統計計算。在模式匹 配中,這種區域性的特徵具有較大的優越性,不會由於局部的偏差而無法匹配成功。作爲一種統計特徵,紋理特徵常具有旋轉不變性,並且對於噪聲有較強的抵抗能 力。但是,紋理特徵也有其缺點,一個很明顯的缺點是當圖像的分辨率變化的時候,所計算出來的紋理可能會有較大偏差。另外,由於有可能受到光照、反射情況的 影響,從 2-D 圖像中反映出來的紋理不一定是 3-D 物體表面真實的紋理。

常用的特徵提取與匹配方法:

紋理特徵描述方法分類

1 )統計方法統計方法的典型代表是一種稱爲灰度共生矩陣的紋理特徵分析方法 Gotlieb Kreyszig 等人在研究共生矩陣中各種統計特徵基礎上,通過實驗,得出灰度共生矩陣的四個關鍵特徵:能量、慣量、熵和相關性。統計方法中另一種典型方法,則是從圖像的自相關函數(即圖像的能量譜函數)提取紋理特徵,即通過對圖像的能量譜函數的計算,提取紋理的粗細度及方向性等特徵參數

2 )幾何法

所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特徵分析方法。紋理基元理論認爲,複雜的紋理可以由若干簡單的紋理基元以一定的有規律的形式重複排列構成。在幾何法中,比較有影響的算法有兩種: Voronio 棋盤格特徵法和結構法。

3 )模型法

模型法以圖像的構造模型爲基礎,採用模型的參數作爲紋理特徵。典型的方法是隨機場模型法,如馬爾可夫( Markov )隨機場( MRF )模型法和 Gibbs 隨機場模型法

4 )信號處理法

紋理特徵的提取與匹配主要有:灰度共生矩陣、 Tamura 紋理特徵、自迴歸紋理模型、小波變換等。

灰度共生矩陣特徵提取與匹配主要依賴於能量、慣量、熵和相關性四個參數。 Tamura 紋理特徵基於人類對紋理的視覺感知心理學研究,提出 6 種屬性,即

:粗糙度、對比度、方向度、線像度、規整度和粗略度。自迴歸紋理模型( simultaneous auto-regressive, SAR )是馬爾可夫隨機場( MRF )模型的一種應用實例。

 

C 形狀特徵

特點:各種基於形狀特徵的檢索方法都可以比較有效地利用圖像中感興趣的目標來進行檢索,但它們也有一些共同的問題,

常用的特徵提取與匹配方法:

通常情況下,形狀特徵有兩類表示方法,一類是輪廓特徵,另一類是區域特徵。圖像的輪廓特徵主要針對物體的外邊界,而圖像的區域特徵則關係到整個形狀區域。

幾種典型的形狀特徵描述方法:

1 )邊界特徵法該方法通過對邊界特徵的描述來獲取圖像的形狀參數。其中 Hough 變換檢測平行直線方法和邊界方向直方圖方法是經典方法。 Hough 變換是利用圖像全局特性而將邊緣像素連接起來組成區域封閉邊界的一種方法,其基本思想是點—線的對偶性;邊界方向直方圖法首先微分圖像求得圖像邊緣,然後,做出關於邊緣大小和方向的直方圖,通常的方法是構造圖像灰度梯度方向矩陣。

2 )傅里葉形狀描述符法

傅里葉形狀描述符 (Fourier shape descriptors) 基本思想是用物體邊界的傅里葉變換作爲形狀描述,利用區域邊界的封閉性和週期性,將二維問題轉化爲一維問題。

由邊界點導出三種形狀表達,分別是曲率函數、質心距離、復座標函數。

3 )幾何參數法

形狀的表達和匹配採用更爲簡單的區域特徵描述方法,例如採用有關形狀定量測度(如矩、面積、周長等)的形狀參數法( shape factor )。在 QBIC 系統中,便是利用圓度、偏心率、主軸方向和代數不變矩等幾何參數,進行基於形狀特徵的圖像檢索。

 

D 空間關係特徵

特點:所謂空間關係,是指圖像中分割出來的多個目標之間的相互的空間位置或相對方向關係,這些關係也可分爲連接 / 鄰接關係、交疊 / 重疊關係和包含 / 包 容關係等。通常空間位置信息可以分爲兩類:相對空間位置信息和絕對空間位置信息。前一種關係強調的是目標之間的相對情況,如上下左右關係等,後一種關係強 調的是目標之間的距離大小以及方位。顯而易見,由絕對空間位置可推出相對空間位置,但表達相對空間位置信息常比較簡單。
空間關係特徵的使用可加強對圖像內容的描述區分能力,但空間關係特徵常對圖像或目標的旋轉、反轉、尺度變化等比較敏感。另外,實際應用中,僅僅利用空間信息往往是不夠的,不能有效準確地表達場景信息。爲了檢索,除使用空間關係特徵外,還需要其它特徵來配合。

常用的特徵提取與匹配方法:

提取圖像空間關係特徵可以有兩種方法:一種方法是首先對圖像進行自動分割,劃分出圖像中所包含的對象或顏色區域,然後根據這些區域提取圖像特徵,並建立索引;另一種方法則簡單地將圖像均勻地劃分爲若干規則子塊,然後對每個圖像子塊提取特徵,並建立索引。

 

 

模式識別

模 式識別是一種從大量信息和數據出發,在專家經驗和已有認識的基礎上,利用計算機和數學推理的方法對形狀、模式、曲線、數字、字符格式和圖形自動完成識別的 過程。模式識別包括相互關聯的兩個階段,即學習階段和實現階段,前者是對樣本進行特徵選擇,尋找分類的規律,後者是根據分類規律對未知樣本集進行分類和識 別。廣義的模式識別屬計算機科學中智能模擬的研究範疇,內容非常廣泛,包括聲音和語言識別、文字識別、指紋識別、聲納信號和地震信號分析、照片圖片分析、 化學模式識別等等。計算機模式識別實現了部分腦力勞動自動化。

模式識別--對錶徵事物或現象的各種形式的(數值的,文字的和邏輯關係的)信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。

模 式還可分成抽象的和具體的兩種形式。前者如意識、思想、議論等,屬於概念識別研究的範疇,是人工智能的另一研究分支。我們所指的模式識別主要是對語音波 形、地震波、心電圖、腦電圖、圖片、文字、符號、三位物體和景物以及各種可以用物理的、化學的、生物的傳感器對對象進行測量的具體模式進行分類和辨識。

模式識別問題指的是對一系列過程或事件的分類與描述,具有某些相類似的性質的過程或事件就分爲一類。模式識別問題一般可以應用以下 4 種方法進行分析處理。

統 計模式識別方法:統計模式識別方法是受數學中的決策理論的啓發而產生的一種識別方法,它一般假定被識別的對象或經過特徵提取向量是符合一定分佈規律的隨機 變量。其基本思想是將特徵提取階段得到的特徵向量定義在一個特徵空間中,這個空間包含了所有的特徵向量,不同的特徵向量,或者說不同類別的對象都對應於空 間中的一點。在分類階段,則利用統計決策的原理對特徵空間進行劃分,從而達到識別不同特徵的對象的目的。統計模式識別中個應用的統計決策分類理論相對比較 成熟,研究的重點是特徵提取。統計模式識別的基本原理是:有相似性的樣本在模式空間中互相接近,並形成 集團 ,即 物以類聚 。其分析方法是根據模式所測得的特徵向量 Xi=(xi1,xi2,…,xid)T(i=1,2,…,N) ,將一個給定的模式歸入 C 個類 ω1,ω2,…,ωc 中,然後根據模式之間的距離函數來判別分類。其中, T 表示轉置; N 爲樣本點數; d 爲樣本特徵數。

統計模式識別的主要方法有:判別函數法,k近鄰分類法,非線性映射法,特徵分析法,主因子分析法等。(shenmeshi.cn收集)

在統計模式識別中,貝葉斯決策規則從理論上解決了最優分類器的設計問題,但其實施卻必須首先解決更困難的概率密度估計問題。BP 神經網絡直接從觀測數據(訓練樣本)學習,是更簡便有效的方法,因而獲得了廣泛的應用,但它是一種啓發式技術,缺乏指定工程實踐的堅實理論基礎。統計推斷 理論研究所取得的突破性成果導致現代統計學習理論——VC理論的建立,該理論不僅在嚴格的數學基礎上圓滿地回答了人工神經網絡中出現的理論問題,而且導出 了一種新的學習方法——支撐向量機。

 

人工神經網絡模式識別:人工神經網絡的研究起源於對生物神經系統的研究。人工神經網絡區別於其他識別方法的最大特點是它對待識別的對象不要求有太多的分析與瞭解,具有一定的智能化處理的特點。

句 法結構模式識別:又稱結構方法或語言學方法。其基本思想是把一個模式描述爲較簡單的子模式的組合,子模式又可描述爲更簡單的子模式的組合,最終得到一個樹 形的結構描述,在底層的最簡單的子模式稱爲模式基元。在句法方法中選取基元的問題相當於在決策理論方法中選取特徵的問題。通常要求所選的基元能對模式提供 一個緊湊的反映其結構關係的描述,又要易於用非句法方法加以抽取。顯然,基元本身不應該含有重要的結構信息。模式以一組基元和它們的組合關係來描述,稱爲 模式描述語句,這相當於在語言中,句子和短語用詞組合,詞用字符組合一樣。基元組合成模式的規則,由所謂語法來指定。一旦基元被鑑別,識別過程可通過句法 分析進行,即分析給定的模式語句是否符合指定的語法,滿足某類語法的即被分入該類。

在幾種算法中,統計模式識別是最經典的分類識別方法,在圖像模式識別中有着非常廣泛的應用。

 

 

參考書籍:美國 岡薩雷斯 數字圖像處理第二版

發佈了8 篇原創文章 · 獲贊 4 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章