2000FPS的人臉檢測算法,開源了!

2000FPS的人臉檢測算法,開源了!

2019年,南方科技大學的於仕琪老師開源了一個當時有史以來最快的人臉檢測算法,影響頗大。前天,這個項目更新了,添加了5點的landmark輸出,並且開源了其訓練方法。

先來看一組數據,在i7-1065G7 CPU上可以直接幹到近2000fps
在這裏插入圖片描述

於老師團隊表示,由於疫情在家,瘋狂嘗試了很多想法,大部分都失敗了,但是最後一個成功了,成功了就直接給發出來了,不僅重寫了關鍵的代碼,而且公開了pytorch的訓練方法,而且項目的Licence採用了3-Clause BSD License,直接可以商用。

此次的更新,有以下幾個亮點

  • 採用8位整型計算,全部卷積操作無浮點運算,運算速度大幅提升
  • 採用指令集加速,Intel平臺可以使用AVX,ARM平臺可以使用NEON
  • 在ARM平臺還可以使用Tengine加速,Tengine詳細手冊
  • 不依賴任何三方庫,只要能編譯C++,就能跑起來
  • 公開了訓練代碼,自己想怎麼改,就怎麼改!!!

去年公佈的檢測算法,據說是基於caffe框架訓練的,這次訓練過程全部換成pytorch平臺了,因爲pytorch平臺上修改自定義的模型比caffe上要方便很多。

去年3月份的時候,上一代的libfacedetection算法開源,影響甚廣,我還記得當時對於MTCNN派和SSD派一些討論。有一部分人熱衷於在MTCNN上做修改然後工程化,有一部分人熱衷於在SSD框架上做項目落地。
在這裏插入圖片描述
在這裏插入圖片描述

提出issue的一名北航的博士,在MTCNN上做了很多文章,並且自己做了一套利於部署的框架,叫做ZQCNN,目前star數量已經超過1.8K

libfacedetection新算法訓練程序參考了中科院自動化所張士峯的FaceBoxes.PyTorch以及Max deGroot的ssd.pytorch,在訓練過程中,前100個epoch只訓練人臉檢測,後面400個epoch人臉檢測和landmark檢測同時訓練

此次新的更新,對於工業界將是一次重大利好,直接指導了從訓練到部署的全套技術流程,從訓練模型合併bn層,到模型8位定點化,並且自動生成CPP部署
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-yjMOHdi2-1584897935312)(https://i.loli.net/2020/03/08/2XUC8dKfcDEuG6J.png)]

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章