表情識別研究

表情識別研究

學習文章:https://zhuanlan.zhihu.com/p/40572244

參考:人臉表情識別技術研究綜述-2022

表情識別(FER,facialexpression recognition)是人臉識別(FR,face recognition)技術中的重要組成部分。

人臉表情識別系統,主要包括人臉圖像提取,人臉檢測,特徵提取,特徵分類四部分。

img

圖像獲取

很多開源數據集:JAFFE、CK+、AFEW、FER2013、MMI等

人臉檢測

1、作用:確定圖像中所有人臉的所在位置,去除非面部區域。

2、傳統方式:(1)通過哈爾特徵等特徵分類器進行訓練;(2)使用Viola-Jones人臉檢測器

3、深度學習的方式:(1)Faster-RCNN、YOLO等

人臉對齊

1、作用:提高面部表情識別精度

2、具體爲:在一張人臉圖像中搜索人臉預先定義的點的問題,它 通常從粗糙的初始形狀開始,並通過逐步細化形狀估 計直到收斂

人臉歸一化

1、作用:解決光照的不同方向和頭部面朝方向的差異會對識別面部特徵的性能影響

2、方法:基於各向同性擴散的歸一 化、基於離散餘弦變換的歸一化、高斯差分和基於同態濾波的歸一化等

具體請參考論文

特徵提取

表情特徵提取主要採用數學方法,依靠計算機技術對人臉表情的數字圖像進行數據的組織和處理,提取表情特徵,去除非表情噪聲的方法。在某些情況下,特徵提取算法提取了圖像的主要特徵,客觀上降低了圖像的維數,因此這些特徵提取算法也具有降維的作用。

表情特徵提取算法大體分爲基於靜態圖像的特徵提取方法基於動態圖像的特徵提取方法。其中基於靜態圖像的特徵提取算法可分爲整體法局部法,基於動態圖像的特徵提取算法又分爲光流法模型法幾何法

以上都是傳統的研究方法,需要使用手動提取的特徵,或是淺層學習,識別功能有限。下面將深度學習融入其中

特徵提取(深度學習)

1、深度信念網絡(Deep Belief Network,DBN)

2、自動編碼器

3、深度卷積神經網絡(CNN)

4、生成對抗網絡(Generative Adversarial Networks, GAN)

深度學習中的網絡(尤其是CNN對圖像具有較好的提取特徵的能力,從而避免了人工提取特徵的繁瑣。

具體的基於深度學習進行特徵提取的知識就看不懂了。

特徵分類

特徵分類的目的是判斷特徵所對應的表情類別。在人臉表情識別中,表情的類別分爲兩部分:基本表情和動作單元。前者一般適用於所有的處理對象,後者主要適用於動態圖像,可以將主要的特徵分類方法分爲基於貝葉斯網絡的分類方法基於距離度量的分類方法

(1)基於貝葉斯網絡的分類

以貝葉斯公式爲基礎、基於概率推理的圖形化網絡。從人臉表情識別的角度出發,概率推理的作用就是從已知表情信息中推斷出未知表情的概率信息的過程。基於貝葉斯網絡的方法包括各種貝葉斯網絡分類算法和隱馬爾科夫模型(HMM)算法。

(2)基於距離度量的分類

通過計算樣本之間的距離來實現表情分類的。代表算法有近鄰法和SVM算法。近鄰法是比較未知樣本與所有已知類別的樣本之間的歐式距離,通過距離的遠近來決策未知樣本與已知樣本是否同類;SVM算法則是通過優化目標函數,尋找到使不同類別樣本之間距離最大的分類超平面。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章