【模式識別】課程筆記(一)

1.1 什麼是模式識別

什麼是模式識別呢,認識這個問題首先要理解什麼是模式。
從認知科學的角度來看,認知過程中的一切行爲都歸結爲識別;從哲學的角度來看是尋求物質的本質屬性;回到工程的角度,針對給定的任務和應用研究如何使計算機具有識別能力。
說到底就是對某個事物或者概念的理解,從而形成一種認知。比如什麼樣的物體是桌子,什麼樣的是凳子。模式識別發現規律,應用規律的過程。
模式是待識別對象的一組屬性集合,例如蘋果:{顏色、形狀、糖度、酸度、重量…}
而識別或者說分類則是根據模式的描述判斷不同的識別對象是否屬於相同的類別
而現在的人工智能,某種意義上也只是高維空間的模式識別

1.2 模式識別系統

一般的模式識別就是預處理,然後進行特徵計算,最後再進行分類
舉個例子,蘋果與橘子的分類,比如通過rgb三個通道值、x和h形成一個五維特徵。其中藍色分量作用比較低可以去掉,爲了進行無量綱化最後形成(R / G, x / h)
提取特徵後根據這個特徵進行分類,最終得到模式識別的結果
模式識別的分類面要儘可能有泛化能力

1.3 模式識別的幾個關鍵概念

具體問題、具體分析
醜小鴨定理:根據問題確定特徵計算方法
“醜小鴨與白天鵝之間的區別和兩隻白天鵝之間的區別一樣大”。
世界上不存在相似性的客觀標準,必須根據問題需求,確定“相似性”標準
沒有免費的午餐:根據問題確定分類方法
如果一個算法對某些問題有效,那麼他一定在另一些問題上比純隨機搜索算法更差。不能脫離具體問題來討論算法的優劣,任何算法都有優劣性,必須根據問題特點,選擇“合適”算法。
歸納偏置(inductive biases):模型會對學習的問題做一些假設,即所謂的認知偏好。
最近鄰分類器:近朱者赤
樸素貝葉斯分類器:每個特徵相互獨立
距離分類器:…,各類別先驗概率相等
卷積神經網絡? 根據問題特點,做出“合適”假設,選擇合適模型
泛化(Generalization):可“推廣”的纔是知識!
VC維:模型複雜度(擬合能力)
奧卡姆剃刀——如無必要勿增實體

1.4 模式識別方法簡介

1、分類與聚類

有監督學習
無監督學習
半監督學習:只有一部分樣本有標籤
標籤不可靠:弱監督學習

2、統計模式識別與結構模式識別

統計方法:將模式看作爲空間中的一個點,採用解析幾何和概率論、數理統計的方法判別輸入模式的類別數學
結構方法:將模式看成是由一些基本元素有組織的構成,利用形式語言和自動機理論對模式的結構進行分析和判別;

3、鑑別模型與產生式模型

鑑別模型主要學習一個分類面,然後判斷點所在的區域進行分類
而產生式模型則是根據模式在某點的出現的概率來判斷該點所屬類別

4、支持向量機與神經網絡
5、從淺層到深層

淺層學習,使用特徵工程,特徵選擇與提取嚴重依賴專家經驗進行
深度學習:表示學習模型的結構依賴專家經驗而自動學習自動學習調整模型結構
隨着網絡的加深,逐步提取到信號的高級特徵,實現理解

1.5 模式識別應用舉例

自動駕駛、強化學習

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章