卷積神經網絡-Deformable Convolutional可變形卷積詳解[下]

原創

2020-07-01 16:33

AI研習圖書館，發現不一樣的世界

Deformable Convolutional——可變形卷積

在深度學習的計算機視覺任務中，如果使用可變形卷積，則可以顯著提升Faster R-CNN和R-FCN等算法在物體檢測和分割上的性能。只需要增加很少的計算量，就可以得到性能的提升，Deformable Convolutional，非常好的文章，值得一看~

5. 消融研究和實驗結果

5.1 使用可變形卷積在不同數量的最後幾層上

3和6個可變形卷積也很好。最後，作者選擇3，因爲可以很好地權衡用於不同的任務。
我們還可以看到DCN改進了DeepLab，class-aware RPN(或認爲是簡化的SSD），fast - R-CNN和R-FCN

5.2. 可變形卷積偏移距離分析

上述分析亦說明了DCN的有效性。首先，根據ground truth bound
box標註和濾波器中心的位置，將可變形卷積濾波器分爲四類：small、medium、large和background。
然後測量膨脹值(偏移距離)的均值和標準差。發現可變形濾波器的感受野大小與目標大小相關，說明可以有效地從圖像內容中學習變形。
背景區域的濾波器大小介於中、大物體之間，說明識別背景區域需要較大的感受野。

與可變形RoI pooling類似，現在部分被偏移以覆蓋非剛性物體。

5.3 在PASCAL VOC上和Atrous卷積對比

只使用可變形卷積：DeepLab，class-aware RPN， R-FCN使用可變形卷積都得到了改進，已經優於使用atrous
convolution實現的DeepLab，RPN和R-FCN。與atrous convolution相比，Faster
R-CNN使用可變形卷積更具有競爭優勢。
只使用Deformable RoI Pooling：在Faster R-CNN和R-FCN中只使用Deformable RoI
Pooling。對於Faster-RCNN，兩者差不多，對於R-FCN，Deformable RoI Pooling更好。
使用可變形卷積和Deformable RoI Pooling：對於Faster
R-CNN和R-FCN，使用可變卷積核可變ROI池化效果是最好的。

5.4 PASCAL VOC上的模型複雜度和運行時間

可變形卷積只在模型參數和計算上增加很小的開銷
除了增加模型參數之外，顯著的性能改進來自於模型幾何變換的能力。

英文原文：英文文獻

卷積神經網絡基礎知識系列筆記不斷更新中，學習筆記，在此記錄~

推薦閱讀文章
[1] AI入門-人工智能的前世今生
[2] AI入門-深度學習綜述
[3] AI入門-計算機視覺學習指南[附資源]
[4] 深度學習框架總結—國際篇
[5] 深度學習-CNN結構設計技巧
[6] 資源分享-深度學習及數據分析等資源合集
[7] 今日分享—統計學習方法
[8] 算法總結—人臉檢測算法
[9] 目標檢測算法-YOLOv4
[10] 項目總結—人臉檢測
[11] 項目實戰-人臉口罩檢測
[12] 深度學習基礎-二十種損失函數
[13] 深度學習-目標檢測的十九個研究方向
[14] 項目實戰-車輛檢測案例實現
[15] Python學習-實戰小案例
[16] 數據結構與算法-Python語言案例實現
…

AI研習圖書館

轉載是一種動力分享是一種美德

關注AI研習圖書館，發現不一樣的精彩世界

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

卷積神經網絡-Deformable Convolutional可變形卷積詳解[下]

Deformable Convolutional——可變形卷積

5. 消融研究和實驗結果

5.1 使用可變形卷積在不同數量的最後幾層上

5.2. 可變形卷積偏移距離分析

5.3 在PASCAL VOC上和Atrous卷積對比

5.4 PASCAL VOC上的模型複雜度和運行時間

DAPPER 事務 TRANSACTION

深度學習—數據處理常用代碼Python合集

數據處理-Python批量修改文件夾下含多個文件夾中的所有圖片名稱

目標檢測—視頻檢測測試代碼

深度學習數據處理—Python處理文件夾下相同和不同的圖像數據（xml-jpg互找）

LeetCode筆記-機器人的運動範圍（ Python圖解）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結