圖像模式識別 (二)

圖像識別

圖像識別的四個主要步驟:

圖像預處理

圖象分割

圖像特徵提取

圖象分類

圖像輸入

圖像處理

圖像識別

像元圖像

圖像預處理

濾去幹擾,噪聲等。如圖像信息微弱,還要進行增強處理,幾何調整,着色校正等。

圖象分割

從圖像中定位,分離出不同的待識別物體。這一過程輸入的是整幅圖像,輸出是像元圖像。

圖像特徵抽取

提到需要特徵並對某些參數進行計算,測量,根據結果進行分類。

圖像分類

根據撮特徵值,利用模式識別方法進行分類,確定相關信息。

 

 

三、圖像數據結構與圖像文件格式:

在計算機中,按照顏色和灰度的多少可以將圖像爭爲二值圖像、灰度圖像、索引圖像和真彩色RGB圖像四種基本類型。目前,大多數圖像處理軟件都支持這四種類型的圖像。

(1) 二值圖像:

一幅二值圖像的二維矩陣僅由01兩個值構成,“0”代表黑色,“1”代白色。由於每一像素(矩陣中每一元素)取值僅有01兩種可能,所以計算機中二值圖像的數據類型通常爲1個二進制位。二值圖像通常用於文字、線條圖的掃描識別(OCR)和掩膜圖像的存儲。

(2) 灰度圖像:

灰度圖像矩陣元素的取值範圍通常爲[0255]。因此其數據類型一般爲8位無符號整數的(int8),這就是人們經常提到的256灰度圖像。“0”表示純黑色,“255”表示純白色,中間的數字從小到大表示由黑到白的過渡色。在某些軟件中,灰度圖像也可以用雙精度數據類型(double)表示,像素的值域爲[01]0代表黑色,1代表白色,01之間的小數表示不同的灰度等級。二值圖像可以看成是灰度圖像的一個特例。

(3) 索引圖像:

索引圖像的文件結構比較複雜,除了存放圖像的二維矩陣外,還包括一個稱之爲顏色索引矩陣MAP的二維數組。MAP的大小由存放圖像的矩陣元素值域決定,如矩陣元素值域爲[0255],則MAP矩陣的大小爲2563,用MAP=[RGB]表示。MAP中每一行的三個元素分別指定該行對應顏色的紅、綠、藍單色值,MAP中每一行對應圖像矩陣像素的一個灰度值,如某一像素的灰度值爲64,則該像素就與MAP中的第64行建立了映射關係,該像素在屏幕上的實際顏色由第64行的[RGB]組合決定。也就是說,圖像在屏幕上顯示時,每一像素的顏色由存放在矩陣中該像素的灰度值作爲索引通過檢索顏色索引矩陣MAP得到。索引圖像的數據類型一般爲8位無符號整形(int8),相應索引矩陣MAP的大小爲2563,因此一般索引圖像只能同時顯示256種顏色,但通過改變索引矩陣,顏色的類型可以調整。索引圖像的數據類型也可採用雙精度浮點型(double)。索引圖像一般用於存放色彩要求比較簡單的圖像,如Windows中色彩構成比較簡單的壁紙多采用索引圖像存放,如果圖像的色彩比較複雜,就要用到RGB真彩色圖像。

(4) RGB彩色圖像:

RGB圖像與索引圖像一樣都可以用來表示彩色圖像。與索引圖像一樣,它分別用紅(R)、綠(G)、藍(B)三原色的組合來表示每個像素的顏色。但與索引圖像不同的是,RGB圖像每一個像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中,由於每一像素的顏色需由RGB三個分量來表示,MN分別表示圖像的行列數,三個M x N的二維矩陣分別表示各個像素的RGB三個顏色分量。RGB圖像的數據類型一般爲8位無符號整形,通常用於表示和存放真彩色圖像,當然也可以存放灰度圖像。

                                       

 

數字化圖像數據有兩種存儲方式[6]:位圖存儲(Bitmap)和矢量存儲(Vector)
我們平常是以圖像分辨率(即象素點)和顏色數來描述數字圖象的。例如一張分辨率爲640*480,16位色的數字圖片,就由2^16=65536種顏色的307200(=640*480)個素點組成。

  位圖圖像:位圖方式是將圖像的每一個象素點轉換爲一個數據,當圖像是單色(只有黑白二色)時,8個象素點的數據就佔據一個字節(一個字節就是8個二進制數,1個二進制數存放象素點);16色的圖像每兩個象素點用一個字節存儲;256色圖像每一個象素點用一個字節存儲。這樣就能夠精確地描述各種不同顏色模式的圖像圖面。位圖圖像彌補了矢量式圖像的缺陷,它能夠製作出色彩和色調變化豐富的圖像,可以逼真地表現自然界的景象,同時也可以很容易地在不同軟件之間交換文件,這就是位圖圖像的優點;而其缺點則是它無法制作真正的3D圖像,並且圖像縮放和旋轉時會產生失真的現象,同時文件較大,對內存和硬盤空間容量的需求也較高。位圖方式就是將圖像的每一像素點轉換爲一個數據。如果用1位數據來記錄,那麼它只能代表2種顏色(21=2);如果以8位來記錄,便可以表現出256種顏色或色調(28=256),因此使用的位元素越多所能表現的色彩也越多。通常我們使用的顏色有16色、256色、增強16位和真彩色24位。一般所說的真彩色是指24(28×28×28)的位圖存儲模式適合於內容複雜的圖像和真實照片。但隨着分辨率以及顏色數的提高,圖像所佔用的磁盤空間也就相當大;另外由於在放大圖像的過程中,其圖像勢必要變得模糊而失真,放大後的圖像像素點實際上變成了像素方格 用數碼相機和掃描儀獲取的圖像都屬於位圖。

矢量圖像:矢量圖像存儲的是圖像信息的輪廓部分,而不是圖像的每一個象素點。例如,一個圓形圖案只要存儲圓心的座標位置和半徑長度,以及圓的邊線和半徑長度,以及圓的邊線和內部的顏色即可。該存儲方式的缺點是經常耗費大量的時間做一些複雜的分析演算工作,圖像的顯示速度較慢;但圖像縮放不會失真;圖像的存儲空間也要小得多。所以,矢量圖比較適合存儲各種圖表和工程設計圖。

 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章