卷積神經網絡-Deformable Convolutional可變形卷積詳解[下]

AI研習圖書館,發現不一樣的世界

Deformable Convolutional——可變形卷積

在深度學習的計算機視覺任務中,如果使用可變形卷積,則可以顯著提升Faster R-CNN和R-FCN等算法在物體檢測和分割上的性能。只需要增加很少的計算量,就可以得到性能的提升,Deformable Convolutional,非常好的文章,值得一看~

在這裏插入圖片描述

5. 消融研究和實驗結果

5.1 使用可變形卷積在不同數量的最後幾層上

在這裏插入圖片描述

  • 3和6個可變形卷積也很好。最後,作者選擇3,因爲可以很好地權衡用於不同的任務。
  • 我們還可以看到DCN改進了DeepLab,class-aware RPN(或認爲是簡化的SSD),fast - R-CNN和R-FCN

5.2. 可變形卷積偏移距離分析

在這裏插入圖片描述
在這裏插入圖片描述

  • 上述分析亦說明了DCN的有效性。首先,根據ground truth bound

  • box標註和濾波器中心的位置,將可變形卷積濾波器分爲四類:small、medium、large和background。

  • 然後測量膨脹值(偏移距離)的均值和標準差。 發現可變形濾波器的感受野大小與目標大小相關,說明可以有效地從圖像內容中學習變形。

  • 背景區域的濾波器大小介於中、大物體之間,說明識別背景區域需要較大的感受野。

在這裏插入圖片描述

  • 與可變形RoI pooling類似,現在部分被偏移以覆蓋非剛性物體。

5.3 在PASCAL VOC上和Atrous卷積對比

在這裏插入圖片描述

  • 只使用可變形卷積:DeepLab,class-aware RPN, R-FCN使用可變形卷積都得到了改進,已經優於使用atrous
    convolution實現的DeepLab,RPN和R-FCN。與atrous convolution相比,Faster
    R-CNN使用可變形卷積更具有競爭優勢。

  • 只使用Deformable RoI Pooling:在Faster R-CNN和R-FCN中只使用Deformable RoI
    Pooling。對於Faster-RCNN,兩者差不多,對於R-FCN,Deformable RoI Pooling更好。

  • 使用可變形卷積和Deformable RoI Pooling:對於Faster
    R-CNN和R-FCN,使用可變卷積核可變ROI池化效果是最好的。

5.4 PASCAL VOC上的模型複雜度和運行時間

在這裏插入圖片描述

  • 可變形卷積只在模型參數和計算上增加很小的開銷

  • 除了增加模型參數之外,顯著的性能改進來自於模型幾何變換的能力。

英文原文:英文文獻

卷積神經網絡基礎知識系列筆記不斷更新中,學習筆記,在此記錄~

推薦閱讀文章
[1] AI入門-人工智能的前世今生
[2] AI入門-深度學習綜述
[3] AI入門-計算機視覺學習指南[附資源]
[4] 深度學習框架總結—國際篇
[5] 深度學習-CNN結構設計技巧
[6] 資源分享-深度學習及數據分析等資源合集
[7] 今日分享—統計學習方法
[8] 算法總結—人臉檢測算法
[9] 目標檢測算法-YOLOv4
[10] 項目總結—人臉檢測
[11] 項目實戰-人臉口罩檢測
[12] 深度學習基礎-二十種損失函數
[13] 深度學習-目標檢測的十九個研究方向
[14] 項目實戰-車輛檢測案例實現
[15] Python學習-實戰小案例
[16] 數據結構與算法-Python語言案例實現

AI研習圖書館

轉載是一種動力 分享是一種美德

關注AI研習圖書館,發現不一樣的精彩世界
在這裏插入圖片描述
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章