圖像模式識別 (七)

主要識別方法

1)模板匹配識別

利用模板匹配可以在一幅圖象中找到已知的物體。比如抓拍到了一張射門的照片,要在該照片中找到足球的位置。這時就可以採用模板匹配的方法。所謂模板匹配,其實想法很簡單:拿已知的模板(在本例中爲足球的圖象),和原圖象中同樣大小的一塊區域去對。最開始時,模板的左上角點和圖象的左上角點是重合的,拿模板和原圖象中同樣大小的一塊區域去對比,然後平移到下一個象素,仍然進行同樣的操作,……所有的位置都對完後,差別最小的那塊就是我們要找的物體。

我們用平方誤差之和來衡量原圖中的塊和模板之間的差別。假設模板的大小爲m×n(寬×高);圖象的大小爲Width×Height。模板中的某點座標爲(x0,y0),該點的灰度爲U(x0,y0);與之重合的圖象中的點座標爲(X0-x0,Y0-y0),該點的灰度爲V(X0-x0,Y0-y0)。則一次匹配的結果爲:

全部圖象都匹配後,找到最小的即爲結果。可以看到模板匹配的運算量是驚人的。一次匹配都要做m×n次減法,m×n次平方,m×n-1次加法,整個圖象要匹配(Width-m+1) ×(Height-n+1)次。

 

2)統計模式識別

統計模式識別,對模式的統計分類方法,把模式類看成是用某個隨機向量實現的集合。又稱決策理論識別方法。屬同一類別的各個模式之間的差異,部分是由環境噪聲和傳感器的性質所引起,部分是模式本身所具有的隨機性質。統計模式識別方法是用給定的有限數量樣本集,在已知研究對象統計模型或已知判別函數類條件下,根據一定的準則通過學習算法把d維特徵空間劃分爲c個區域,每一個區域與每一類別相對應。模式識別系統在進行工作時只要判斷被識別的對象落入哪一區域,就能確定它所屬的類別。由噪聲和傳感器所引起的變異性,可通過預處理而部分消除;而模式本身固有的變異性則可通過特徵抽取和特徵選擇得到控制,儘可能使模式在該特徵空間中的分佈滿足上述理想條件。因此一個統計模式識別系統應包含預處理、特徵抽取、分類器等部分。

也就是說統計地方中每個模式都是d維空間中的一個點,目標就是選擇一些模式向量將不同的模式分配到不同的模式空間的區域上,對於每個類別給定的訓練集,在模式空間中建立一些分割邊界將不同的模式分到不同的類別中,統計方法中,這個邊界是基於每個類的模式的概率分佈的,這點必須預先知道或通過學習獲得,學習就分參數化和非參數化的,前者對應知道其分佈需要估計其分佈參數,這個由樣本空間可完成,而後者是採用核函數的方式進行估計,同時分割邊界一般是基於一定準則建立的,如最小均方誤差準則。

 

3)人工神經網絡識別

         人工神經網絡( Artificial Neural Networks 簡寫爲ANNs)也簡稱爲神經網絡(NNs)或稱作連接模型(Connectionist Model ,是對人腦或自然神經網絡(Natural Neural Network)若干基本特性的抽象和模擬。人工神經網絡以對大腦的生理研究成果爲基礎 的,其目的在於模擬大腦的某些機理與機制,實現某個方面的功能。國際著名的神經網絡研究專家,第一家神經計算機公司的創立者 與領導人HechtNielsen給人工神經網絡下的定義就是:“人工神經網絡是由人工建立的以有向圖爲拓撲結構的動態系統,它通過對連 續或斷續的輸入作狀態相應而進行信息處理。” 這一定義是恰當的。 人工神經網絡的研究,可以追溯到 1957Rosenblatt提出的感知器(Perceptron)模型 。它幾乎與人工智能——AIArtificial Intelligence)同時起步,但30餘年來卻並未取得人工智能那樣巨大的成功,中間經歷了一段長時間的蕭條。直到80年代,獲得了關於 人工神經網絡切實可行的算法,以及以Von Neumann體系爲依託的傳統算法在知識處理方面日益顯露出其力不從心後,人們才重新對 人工神經網絡發生了興趣,導致神經網絡的復興。 目前在神經網絡研究方法上已形成多個流派,最富有成果的研究工作包括:多層網絡 BP算法(誤差反傳播算法)Hopfield網絡模型,自適應共振理 論,自組織特徵映射理論等。人工神經網絡是在現代神經科學的基礎上提出來的。它雖然反映了人腦功能的基本特徵,但遠不是自然 神經網絡的逼真描寫,而只是它的某種簡化抽象和模擬。

    人工神經網絡識別是一種複雜的並行的非線性系統,完成複雜的計算,網絡的最大特點就是從訓練數據中學習到輸入-輸出間的複雜關係,並對數據具有適應性。網絡的結構是千萬種,但最常用的就是前饋結構,如多層感知器及徑向基函數兩種。神經網絡中的隱層可完成特性的抽取及選擇功能,所以適應性很強,理論上,網絡模型等價於經典的統計方法,實際上統計信息就是從樣本中獲得。

 

1. 人工神經網絡的特點

 

人工神經網絡的以下幾個突出的優點使它近年來引起人們的極大關注:

(1)可以充分逼近任意複雜的非線性關係;

(2)所有定量或定性的信息都等勢分佈貯存於網絡內的各神經元,故有很強的魯棒性和容錯性;

(3)採用並行分佈處理方法,使得快速進行大量運算成爲可能;

(4)可學習和自適應不知道或不確定的系統;

(5)能夠同時處理定量、定性知識。

 

人工神經網絡的特點和優越性,主要表現在三個方面:

第一,具有自學習功能。例如實現圖像識別時,只在先把許多不同的圖像樣板和對應的應識別的結果輸入人工神經網絡,網絡就 會通過自學習功能,慢慢學會識別類似的圖像。自學習功能對於預測有特別重要的意義。預期未來的人工神經網絡計算機將爲人類提 供經濟預測、市場預測、效益預測,其應用前途是很遠大的。

第二,具有聯想存儲功能。用人工神經網絡的反饋網絡就可以實現這種聯想。

第三,具有高速尋找優化解的能力。尋找一個複雜問題的優化解,往往需要很大的計算量,利用一個針對某問題而設計的反饋型 人工神經網絡,發揮計算機的高速運算能力,可能很快找到優化解。

4)句法結構模式識別

用句法分析方法進行識別的模式可用較簡單的子模式來描述,依次類推,直到最簡單的子模式——“基元”。用一組“基元”組合和關聯表示模式結構與用一組單字組合和關聯表示語言句子是對應的,即基元、子模式、模式分別對應於單字、詞組、句子;而將基元組合、關聯所必須遵守的規則對應於語言句法。利用語言學中的文法知識進行模式的結構分析和分類就是模式識別的句法分析方法。

     用句法分析方法進行識別、分類的問題可歸納爲:稱待識別的類別爲W1W2、…、Wi,其相應的文法是L(G1)L(G2)、…、L(Gi),若有XL(Gi),則判別XWi。句法知識系統中的知識庫是由文法產生式構成的,每個文法產生式[A→β]表達知識[IFβ,THEN A]。產生式AX1X2X3XS可表達知識[IFX1X2X3…∧XS,THEN A],其中X1X2X3XS是合取,AND關係。如果在產生式集P中有左邊都爲A的產生式子集PA={A→β1,A→β2,A→β3,,A→βS},則表示[IFβ1∨β2∨β3∨…∨βS,THEN A],β1、β2、β3、…、βS爲析取,OR關係。由於PA中產生式爲“或”的關係,因此牽連較少,知識庫可方便地進行修改,並且不影響推理機。

 

 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章