傳統人臉檢測算法 論文閱讀筆記

梳理:

A Convolutional Neural Network Cascade for Face Detection是CNN與級聯思想在檢測的應用

From Facial Parts Responses to Face Detection A Deep Learning Approach是關鍵點檢測與CNN結合的思想

Object Detection with Pixel Intensity Comparisons Organized in Decision Trees 是決策樹思想

Joint Cascade Face Detection and Alignment 是用決策樹實現檢測與矯正結合的思想

Face Alignment at 3000 FPS via Regressing Local Binary Features 是上文的關鍵點檢測算法

 

實現思路:

研究主要集中於以下三點內容:

第一部分是關於特徵的設計與選擇,有效的特徵能夠表達圖像中所蘊藏的信息,同時又足夠簡單,有助於減少計算量。

第二部分是關於人臉檢測與矯正的結合方法,人臉檢測與矯正,一個是二分類問題,一個是迴歸問題,將二者結合在一起的目的不僅僅是爲了節省時間效率,更是爲了利用矯正的結果提高人臉檢測的準確率與速度。

第三部分是關於決策樹與卷積神經網絡級聯結構的設計,該卷積神經網絡需要與決策樹相契合,一種做法是在級聯的前端選擇決策樹,後端選擇卷積神經網絡,這樣可以在前端過濾掉大多數負例,在後端利用CNN來保證較高的正確率。

各個部分的關鍵問題主要集中於以下幾點:

1、關於特徵的選擇,由於人類檢測與矯正需要在同一步完成,那麼就需要這種特徵既能用於人臉檢測,又能用於人臉矯正,這需要它具有廣泛的適用性。

2、人臉檢測與矯正的結合方式無論是決策樹還是卷積神經網絡,雖然都已有實現的先例,但由於我們的框架採用了決策樹與神經網絡混合的結構,那麼就不能只是生硬的銜接二者,否則會使整個框架過於複雜,需要重新設計二者算法,使其流暢的貫穿於整個過程。

3、目前決策樹與卷積神經網絡的結合並沒有被廣泛認可的實現,實現一種真正能一加一大於二的聯合方式將是本文的重點與難點。

初步技術思路:

針對第一部分,特徵的選擇上應以簡單與有效爲首要,針對隨機像素點或是以LBP提取像素域的隨機對比有着出色的表現效果,可以延用或是設計一種新的特徵表達方法。

針對第二部分,人臉檢測與矯正的結合,在決策樹方面,近年來已有其分類樹與迴歸樹的加權結合方法[8],而在卷積神經網絡方面,也提出一種以關鍵點爲特徵的檢測人臉的神經網絡結構[7],Yang S等人提出的DCN網絡結構雖然能在一輪卷積計算中計算出所有的特徵map,但是在大多數實際應用中,圖片中的人臉數量主要爲一個且位於中心,如果能夠利用決策樹在前期提供一些候選人臉區域,然後再用DCN分別卷積計算這些小的人臉區域,雖然卷積輪數變多了,但是由於輸入圖片變小,計算量是指數級下降的。

針對第三部分,決策樹與卷積神經網絡的結合,目前決策樹的級聯框架較爲常見,卷積神經網絡的級聯結構也已有實現,可以將二者去頭掐尾的結合到一起,但是也可以設計出一種更簡潔有效的拓撲結構將二者級聯到一起。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章