項目地址:https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB
近日,用戶Linzaer在Github上開源了一款適用於邊緣計算設備、移動端設備以及 PC 的超輕量級通用人臉檢測模型,該模型文件大小僅1MB,一經開源就霸榜Github Trending榜單。
據Linzaer介紹,該模型設計是針對邊緣計算設備或低算力設備(如用ARM推理)設計的,可以在低算力設備中如用ARM進行實時的通用場景的人臉檢測推理,同樣適用於移動端、PC。
主要具有如下特性:
在模型大小上,默認FP32精度下(.pth)文件大小爲 1.04~1.1MB,推理框架int8量化後大小爲 300KB 左右。
在模型計算量上,320x240的輸入分辨率下 90~109 MFlops左右。
模型有兩個版本,version-slim(主幹精簡速度略快),version-RFB(加入了修改後的RFB模塊,精度更高)。
提供了320x240、640x480不同輸入分辨率下使用widerface訓練的預訓練模型,更好的工作於不同的應用場景。
支持onnx導出,便於移植推理。
目前測試過正常的運行環境如下:
Ubuntu16.04、Ubuntu18.04、Windows 10(inference)
Python3.6
Pytorch1.2
CUDA10.0 + CUDNN7.6
精度、速度、模型大小比較
訓練集是使用Retinaface提供的清理過的widerface標籤配合widerface數據集生成VOC訓練集
Widerface測試
在WIDER FACE test集測試精度(單尺度輸入分辨率:320*240 或按最大邊長320等比縮放)
在WIDER FACE test集測試精度(單尺度輸入分辨率:VGA 640*480 或按最大邊長640等比縮放 )
終端設備推理速度
樹莓派4B MNN推理測試耗時 (單位:ms)(ARM/A72x4/1.5GHz/輸入分辨率 : 320x240 /int8量化)
模型大小比較
圖片效果如下:
來源:開源最前線