人臉表情識別綜述

原文地址:


http://blog.csdn.net/zxia1/article/details/5854914


一、人臉表情識別技術目前主要的應用領域包括人機交互、安全、機器人制造、醫療、通信和汽車領域等

二、1971年,心理學家EkmanFriesen的研究最早提出人類有六種主要情感,每種情感以唯一的表情來反映人的一種獨特的心理活動。這六種情感被稱爲基本情感,由憤怒(anger)、高興(happiness)、悲傷 (sadness)、驚訝(surprise)、厭惡(disgust)和恐懼(fear)組成

 人臉面部表情運動的描述方法---人臉運動編碼系統FACS (Facial Action Coding System),根據面部肌肉的類型和運動特徵定義了基本形變單元AUAction Unit),人臉面部的各種表情最終能分解對應到各個AU上來,分析表情特徵信息,就是分析面部AU的變化情況

 FACS有兩個主要弱點1.運動單元是純粹的局部化的空間模板;2.沒有時間描述信息,只是一個啓發式信息

三、人臉表情識別的過程和方法

1、表情庫的建立:目前,研究中比較常用的表情庫主要有:美國CMU機器人研究所和心理學系共同建立的Cohn-Kanade AU-Coded Facial Expression Image Database(簡稱CKACFEID)人臉表情數據庫;日本ATR建立的日本女性表情數據庫(JAFFE),它是研究亞洲人表情的重要測試庫

2、表情識別:

(1)圖像獲取:通過攝像頭等圖像捕捉工具獲取靜態圖像或動態圖像序列。  

(2)圖像預處理:圖像的大小和灰度的歸一化,頭部姿態的矯正,圖像分割等。

è目的:改善圖像質量,消除噪聲,統一圖像灰度值及尺寸,爲後序特徵提取和分類識別打好基礎

主要工作è人臉表情識別子區域的分割以及表情圖像的歸一化處理(尺度歸一和灰度歸一) 

(3)特徵提取:將點陣轉化成更高級別圖像表述如形狀、運動、顏色、紋理、空間結構等, 在儘可能保證穩定性和識別率的前提下,對龐大的圖像數據進行降維處理

è特徵提取的主要方法有:提取幾何特徵、統計特徵、頻率域特徵和運動特徵等

1採用幾何特徵進行特徵提取主要是對人臉表情的顯著特徵,如眼睛、眉毛、嘴巴等的位置變化進行定位、測量,確定其大小、距離、形狀及相互比例等特徵,進行表情識別

優點:減少了輸入數據量

缺點:丟失了一些重要的識別和分類信息,結果的精確性不高 

2)基於整體統計特徵的方法主要強調儘可能多的保留原始人臉表情圖像中的信息,並允許分類器發現表情圖像中相關特徵,通過對整幅人臉表情圖像進行變換,獲取特徵進行識別。

主要方法:PCAICA(獨立主元分析)

PCAè一個正交維數空間來說明數據變化的主要方向 優點:具有較好的可重建性 缺點:可分性較差

ICAè可以獲取數據的獨立成份,具有很好的可分性

基於圖像整體統計特徵的提取方法缺點:外來因素的干擾(光照、角度、複雜背景等)將導致識別率下降

3)基於頻率域特徵提取: 是將圖像從空間域轉換到頻率域提取其特徵(較低層次的特徵)

 主要方法:Gabor小波變換

 小波變換能夠通過定義不同的核頻率、帶寬和方向對圖像進行多分辨率分析,能有效提取不同方向不同細節程度的圖像特徵並相對穩定,但作爲低層次的特徵,不易直接用於匹配和識別,常與ANN SVM 分類器結合使用,提高表情識別的準確率。 

4)基於運動特徵的提取:提取動態圖像序列的運動特徵(今後研究的重點)

 主要方法:光流法

 光流是指亮度模式引起的表觀運動,是景物中可見點的三維速度矢量在成像平面上的投影,它表示景物表面上的點在圖像中位置的瞬時變化,同時光流場攜帶了有關運動和結構的豐富信息

 光流模型是處理運動圖像的有效方法,其基本思想是將運動圖像函數f (x, y,t)作爲基本函數,根據圖像強度守恆原理建立光流約束方程,通過求解約束方程,計算運動參數

 優點:反映了表情變化的實質,受光照不均性影響較小

 缺點:計算量大 

(4)分類判別:包括設計和分類決策

在表情識別的分類器設計和選擇階段,主要有以下方法:用線性分類器、神經網絡分類器、支持向量機、隱馬爾可夫模型等分類識別方法

1)   線性分類器:假設不同類別的模式空間線性可分,引起可分的主要原因是不同表情之間的差異。

2) 神經網絡分類器:人工神經網絡(Artificial Neural Network,ANN)是一種模擬人腦神經元細胞的網絡結構,它是由大量簡單的基本元件神經元,相互連接成的自適應非線性動態系統。將人臉特徵的座標位置和其相應的灰度值作爲神經網絡的輸入,ANN可以提供很難想象的複雜的類間分界面。

   神經網絡分類器主要有:多層感知器、BP網、RBF

  缺點:需要大量的訓練樣本和訓練時間,不能滿足實時處理要求

3) 支持向量機(SVM)分類算法:泛化能力很強解決小樣本、非線性及高維模式識別問題方面表新的研究熱點

基本思想:對於非線性可分樣本,首先通過非線性變換輸入空間變換到一個高維空間,然後在這個新空間中求取最優線性分界面。這種非線性變換通過定義適當的內積函數實現,常用的三種內積函數爲:多項式內積函數、徑向基內積函數Sigmoid內積函數

4) 隱馬爾可夫模型(Hidden Markov Models, HMM):特點:統計模型、健壯的數學結構,適用於動態過程時間序列建模,具有強大的模式分類能力,理論上可處理任意長度的時序,應用範圍非常廣泛。

優點:運用HMM方法能夠比較精確的描繪表情的變化本質和動態性能

5) 其他方法:

基於人臉物理模型的識別方法,將人臉圖像建模爲可變形的3D網格表面,把空間和灰度放在一個3D空間中同時考慮。

基於模型圖像編碼的方法是使用遺傳算法來編碼、識別與合成各種不同的表情

四、研究展望

1)魯棒性有待提高:

外界因素(主要是頭部偏轉光線變化的干擾)

採用多攝像頭技術、色彩補償技術予以解決,有一定效果,但並不理想

2)表情識別計算量有待降低è確保實時性的要求

3)加強多信息技術的融合

     面部表情不是唯一的情感表現方式,綜合語音語調、脈搏、體溫等多方面信息來更準確地推測人的內心情感,將是表情識別技術需要考慮的問

發佈了8 篇原創文章 · 獲贊 2 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章