模式識別就是識別出特定事物,然後得出這些事物的特徵。
模式識別簡史
1929年 G. Tauschek發明閱讀機 ,能夠閱讀0-9的數字。
30年代 Fisher提出統計分類理論,奠定了統計模式識別的基礎。
50年代 Noam Chemsky 提出形式語言理論——傅京蓀 提出句法結構模式識別。
60年代 L.A.Zadeh提出了模糊集理論,模糊模式識別方法得以發展和應用。
80年代以Hopfield網、BP網爲代表神經網絡模型導致人工神經元網絡復活,並在模式識別得到較廣泛的應用。
90年代小樣本學習理論,支持向量機也受到了很大的重視。
模式分類的主要方法
1.數據聚類
目標:用某種相似性度量的方法將原始數據組織成有意義的和有用的各種數據集。
是一種非監督學習的方法,解決方案是數據驅動的
2.統計分類
基於概率統計模型得到各類別的特徵向量的分佈,以取得分類的方法。
特徵向量分佈的獲得是基於一個類別已知的訓練樣本集。
是一種監督分類的方法,分類器是概念驅動的。
3.結構模式識別
該方法通過考慮識別對象的各部分之間的聯繫來達到識別分類的目的。
識別採用結構匹配的形式,通過計算一個匹配程度值(matching score)來評估一個未知的對象或未知對象某些部分與某種典型模式的關係如何。
當成功地制定出了一組可以描述對象部分之間關係的規則後,可以應用一種特殊的結構模式識別方法 – 句法模式識別,來檢查一個模式基元的序列是否遵守某種規則,即句法規則或語法。
4.神經網絡
神經網絡是受人腦組織的生理學啓發而創立的。由一系列互相聯繫的、相同的單元(神經元)組成。相互間的聯繫可以在不同的神經元之間傳遞增強或抑制信號。
增強或抑制是通過調整神經元相互間聯繫的權重係數來(weight)實現。
神經網絡可以實現監督和非監督學習條件下的分類。
模式識別系統的基本構成
數據獲取:用計算機可以運算的符號來表示所研究的對象
–二維圖像:文字、指紋、地圖、照片等
–一維波形:腦電圖、心電圖、季節震動波形等
–物理參量和邏輯值:體溫、化驗數據、參量正常與否的描述
預處理單元:去噪聲,提取有用信息,並對輸入測量儀器或其它因素所造成的退化現象進行復原
特徵提取和選擇:對原始數據進行變換,得到最能反映分類本質的特徵
測量空間:原始數據組成的空間
特徵空間:分類識別賴以進行的空間
模式表示:維數較高的測量空間->維數較低的特徵空間
分類決策:在特徵空間中用模式識別方法把被識別對象歸爲某一類別
基本做法:在樣本訓練集基礎上確定某個判決規則,使得按這種規則對被識別對象進行分類所造成的錯誤識別率最小或引起的損失最小
模式識別相關的學科
•統計學
•概率論
•線性代數(矩陣計算)
•形式語言
•機器學習
•人工智能
•圖像處理
•計算機視覺
教材/參考文獻
1.R. Duda, P. Hart, D. Stork, Pattern Classification, second edition, 2000(有中譯本).
2.邊肇祺,模式識別(第二版),清華大學出版社,2000。
3.蔡元龍,模式識別,西北電訊工程學院出版社,1986。
模式識別的應用(舉例)
生物學
自動細胞學、染色體特性研究、遺傳研究
天文學
天文望遠鏡圖像分析、自動光譜學
經濟學
股票交易預測、企業行爲分析
醫學
心電圖分析、腦電圖分析、醫學圖像分析
工程
產品缺陷檢測、特徵識別、語音識別、自動導航系統、污染分析
軍事
航空攝像分析、雷達和聲納信號檢測和分類、自動目標識別
安全
指紋識別、人臉識別、監視和報警系統