PaddleX視覺方案介紹


PaddleX目前提供了4種視覺任務解決方案,分別爲圖像分類目標檢測實例分割語義分割。用戶可以根據自己的任務類型按需選取。

圖像分類

圖像分類任務指的是輸入一張圖片,模型預測圖片的類別,如識別爲風景、動物、車等。

_images/image_classification.png

對於圖像分類任務,針對不同的應用場景,PaddleX提供了百度改進的模型,見下表所示

模型 模型大小 GPU預測速度 CPU預測速度 ARM芯片預測速度 準確率 備註
MobileNetV3_small_ssld 12M - - - 71.3% 適用於移動端場景
MobileNetV3_large_ssld 21M - - - 79.0% 適用於移動端/服務端場景
ResNet50_vd_ssld 102.8MB - - - 82.4% 適用於服務端場景
ResNet101_vd_ssld 179.2MB - - - 83.7% 適用於服務端場景

除上述模型外,PaddleX還支持近20種圖像分類模型,模型列表可參考PaddleX模型庫

目標檢測

目標檢測任務指的是輸入圖像,模型識別出圖像中物體的位置(用矩形框框出來,並給出框的位置),和物體的類別,如在手機等零件質檢中,用於檢測外觀上的瑕疵等。

_images/object_detection.png

對於目標檢測,針對不同的應用場景,PaddleX提供了主流的YOLOv3模型和Faster-RCNN模型,見下表所示

模型 模型大小 GPU預測速度 CPU預測速度 ARM芯片預測速度 BoxMAP 備註
YOLOv3-MobileNetV1 101.2M - - - 29.3
YOLOv3-MobileNetV3 94.6M - - - 31.6
YOLOv3-ResNet34 169.7M - - - 36.2
YOLOv3-DarkNet53 252.4M - - - 38.9

YOLOv3模型外,PaddleX同時也支持FasterRCNN模型,支持FPN結構和5種backbone網絡,詳情可參考PaddleX模型庫

實例分割

在目標檢測中,模型識別出圖像中物體的位置和物體的類別。而實例分割則是在目標檢測的基礎上,做了像素級的分類,將框內的屬於目標物體的像素識別出來。

[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Jd3KrknT-1593515028933)(https://paddlex.readthedocs.io/zh_CN/latest/_images/instance_segmentation.png)]

PaddleX目前提供了實例分割MaskRCNN模型,支持5種不同的backbone網絡,詳情可參考PaddleX模型庫

模型 模型大小 GPU預測速度 CPU預測速度 ARM芯片預測速度 BoxMAP SegMAP 備註
MaskRCNN-ResNet50_vd-FPN 185.5M - - - 39.8 35.4
MaskRCNN-ResNet101_vd-FPN 268.6M - - - 41.4 36.8

語義分割

語義分割用於對圖像做像素級的分類,應用在人像分類、遙感圖像識別等場景。

_images/semantic_segmentation.png

對於語義分割,PaddleX也針對不同的應用場景,提供了不同的模型選擇,如下表所示

模型 模型大小 GPU預測速度 CPU預測速度 ARM芯片預測速度 mIOU 備註
DeepLabv3p-MobileNetV2_x0.25 - - - - -
DeepLabv3p-MobileNetV2_x1.0 - - - - -
DeepLabv3p-Xception65 - - - - -
UNet - - - - -
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章