人臉檢測論文彙總(含代碼地址)

論文標題:Multi-view Face Detection Using Deep Convolutional Neural Networks

論文下載地址:http://arxiv.org/abs/1502.02766

代碼下載地址: https://github.com/guoyilin/FaceDetection_CNN

論文簡介:本文考慮的是多角度的人臉檢測問題。在當前已經有很多這方面的工作,而當前最好的方法都需要對人臉關鍵點進行標註,如TSM,或者需要對人臉姿態進行標註,同時還需要訓練十幾個模型,從而能夠在所有方向上抓取所有的人臉,例如HeadHunter方法中需要22個模型。而本文提出深度密度人臉檢測(deep dense face detector,DDFD),不需要姿態或者關鍵點標註,而且能夠用一個單一的模型區抓取各個方向上的人臉。而且不需要額外的組件,比如分割,候選框迴歸,或者SVM分類器等等。

論文貢獻:首先準備數據對AlexNet網絡進行微調,然後通過對正樣本進行裁剪然後使用IOU超過50%的作爲正樣本填充,並通過隨機翻轉等打到了一共200K個正樣本和20百萬個負樣本。然後統一縮放到227x227,並用來微調一個經過預訓練的Alexnet。然後作者採用了劃窗的方法,不斷的從輸入圖片中提取圖片塊,先經過Alexnet做特徵映射,然後將全連接層reshape成二維的,再通過一個人臉分類器。該人臉分類器是由一個5層CNN+3層全連接層組成的網絡。個人認爲,就是不斷的劃窗,然後對一堆窗口進行分類是否是人臉,然後再進行NMS。

論文指標:文中方法在AFW數據集上,AP爲91.79

 

論文標題:Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks

論文下載地址:https://arxiv.org/abs/1604.02878

代碼下載地址:https://github.com/pangyupo/mxnet_mtcnn_face_detection

論文簡介:由於姿勢、光照或遮擋等原因,在非強迫環境下的人臉識別和對齊是一項具有挑戰性的問題。最近的研究顯示,深度學習算法可以很好的解決上述的兩個問題。在這篇文章中,利用檢測和校準之間固有的相關性在深度級聯的多任務框架下來提升它們的性能。尤其是,作者利用三層級聯架構結合精心設計的卷神經網絡算法,來對人臉進行檢測和關鍵點的粗略定位。另外,作者建議使用一種新的在線採集樣本策略來改善算法的性能。文中的方法與FDDB和WIDER FACE數據集上最先進的人臉檢測算法進行對比,具有更高的精度。同時,與AFLW上人臉對齊算法比較,實時性能良好

論文貢獻:在本文中,作者提出新的級聯架構來整合多任務卷積神經網絡學習的問題。該算法有三個階段組成:第一階段,淺層的CNN快速產生候選窗體;第二階段,通過更復雜的CNN精煉候選窗體,丟棄大量的重疊窗體;第三階段,使用更加強大的CNN,實現候選窗體去留,同時顯示五個面部關鍵點定位。通過這個多任務學習框架,算法的性能可以顯著提高。本文的主要貢獻總結如下:(1)提出了一種新的級聯CNNs框架,用於聯合人臉檢測和對齊,並仔細設計了輕量級CNN架構以實現實時性能。(2)提出一種有效的在線難樣本挖掘方法來提高性能。(3)對具有挑戰性的基準進行了大量的實驗,與在面部檢測和麪部對準任務中最先進的技術相比,該方法顯示出顯著的性能改進。

論文指標:作者將文中方法與FDDB中的最新方法以及WIDER FACE中的最新方法進行了比較,ROC曲線中IOU爲0.9504,Easy set情況下,AP爲0.851,Medium set情況下AP爲0.820,Hard set情況下,AP爲0.607。

 

論文標題:FaceBoxes: A CPU Real-time Face Detector with High Accuracy

論文下載地址:https://arxiv.org/abs/1708.05234

代碼下載地址: https://github.com/sfzhang15/FaceBoxes

論文簡介:人臉檢測的挑戰主要來自兩點:1)人臉在複雜背景圖像中的多變性,檢測器需要完成一個複雜的人臉有無問題的二分類;2)人臉位置和尺度的搜索空間較大,這就要求檢測器的計算效率要高。這兩點是有點相互矛盾的,因爲高精度的人臉檢測器通常計算量都是很大。怎麼平衡這兩者之間的矛盾,算法上主要有兩條思路:第一條路就是基於手工設計特徵,代表性檢測器有基於 Adboost 的 Viola-Jones face detector 和 基於級聯結構的 DPM ,但是這些方法過於依賴不魯棒的手工設計的特徵,各個模塊分開優化,使得整個系統是次優的sub-optimal。 第二條路是最近幾年基於深度學習CNN網絡的人臉檢測器。基於 CNN 的人臉檢測雖然性能有較大提升,但是計算量太大。後來有學者提出 cascaded CNN 來 boost the performance and keep efficient。但是 cascaded CNN 有三個問題:1)檢測的速度和圖像中人臉數目有關,人臉越多,檢測速度越慢。2)基於級聯的檢測器每個模塊分開優化,導致模型的訓練難度加大,得到 的模型是 sub-optimal,3)對於 VGA-resolution,cascaded CNN在 CPU上的速度是 14 FPS,沒有得到實時。本文設計了一個CNN網絡用於人臉檢測,在速度和精度上實現了很好的平衡。

論文貢獻:本篇論文主要貢獻如下:1、設計了Rapidly Digested Convolutional Layers;2、引入了Mutiple Scale Convolutional Layers;3、爲了提高小臉的召回率,提出了新的anchor densification strategy; 4、在I5 CPU上測試速度爲38ms。

論文指標:本文方法能夠在CPU上達到20FPS且獲得最好得效果mAP爲96,並且能夠在單GPU上達到125fps。

 

論文標題:RetinaFace: Single-stage Dense Face Localisation in the Wild

論文下載地址:https://arxiv.org/abs/1905.00641

代碼下載地址: https://github.com/deepinsight/insightface/tree/master/RetinaFace

論文簡介:雖然在不受控制的人臉檢測方面已經取得了巨大的進步,但是在wilder上準確有效的人臉定位仍然是一個公開的挑戰。本文提出了一種魯棒的single stage人臉檢測器RetinaFace,它利用聯合的額外監督和自監督多任務學習的優點,對不同尺度的人臉進行像素級定位。

論文貢獻:在以下五個方面做出了貢獻:(1)作者在WILDER FACE數據集中手工標註了5個人臉Landmark,並在這個額外的監督信號的幫助下,觀察到在hard face檢測的顯著改善。(2)進一步添加自監督網格解碼器(mesh decoder)分支,與已有的監督分支並行預測像素級的3D形狀人臉信息。(3)在WILDER FACE hard測試集上,RetinaFace的平均精度(AP)比最先進的平均精度(AP)高出1.1%(達到AP = 91.4%)。(4)在IJB-C測試集上,RetinaFace使現有方法(ArcFace)能夠改進人臉驗證結果(FAR=1e-6, TAR=89.59%)。(5)採用輕量級backbone網絡,RetinaFace可以在單個CPU核上實時運行vga分辨率圖像。

 

論文標題:Finding Tiny Faces

論文下載地址:https://arxiv.org/abs/1612.04402

代碼下載地址:https://github.com/cydonia999/Tiny_Faces_in_Tensorflow

論文簡介:目標識別在最近幾年裏取得了很大的進展,但是小目標識別仍然沒有很好的得到解決。本文針對小的人臉識別問題從三個角度探討:尺度不變性、圖像分辨率、上下文推理。尺度不變性是幾乎是所有的目標檢測和識別系統一個基本的期望屬性,但是從實際的角度來看,尺度不變性只是一定圖像分辨率範圍內成立,例如識別3個像素高度的人臉和識別300像素高度的人臉利用的信息是不一樣的。

論文貢獻:針對尺度問題,目前常用的方法是使用尺度歸一化分類器或者在 ROI 池化特徵圖上運行區域分類器。將區域尺寸歸一化到一個標準尺寸,會面臨一個簡單的問題:標準尺寸應該是多大?一方面作者希望使用一個小的尺寸可以檢測小的人臉,另一方面作者希望使用大尺寸可以分析人臉的細節特徵來增加檢測精度。與一個尺寸打天下相比較,作者分別訓練不同尺度的檢測器,但是這麼做又會導致時間效率低下。爲了解決上述問題,作者採用多任務方式下訓練和運行多尺度分類器,充分利用各個網絡卷積層特徵圖,這個方式對於大目標的檢測效果很好,但是對於小目標的檢測仍然不是很理想。關於小目標檢測的問題,作者提出了兩個見解。(1)如何從預訓練的深度網絡中最佳地提取尺度不變的特徵。(2)雖然許多應用於“多分辨率”的識別系統都是處理一個圖像金字塔,但作者發現在插值金字塔的最底層對於檢測小目標尤爲重要[5]。因此,作者的最終方法是:通過尺度不變方式,來處理圖像金字塔以捕獲大規模變化,並採用特定尺度混合檢測器。 爲了檢測小人臉,作者對圖像分辨率,對象尺度和空間上下文進行了深入分析。作者的算法在FDDB和WIDER FACE取得的state-of-the-art的效果。特別是,在WIDER FACE上,與現有技術相比,作者的結果將誤差降低了2倍。

論文指標:本文方法以ResNet101爲backbone,在Easy情況下mAP0.925,Medium情況下爲0.914,Hard情況下爲0.831

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章