【論文筆記】:MatrixNet

&Title

在這裏插入圖片描述

&Summary

介紹了矩陣網(xNets),這是一種用於目標檢測的新的深層體系結構。
xNets將具有不同大小和縱橫比的對象映射到層中,其中層中對象的大小和縱橫比幾乎是一致的。 因此,xNets提供了比例和縱橫比感知的體系結構。

XNets解決的問題:

  • 使用正方形的 Kernel 來提取不同寬高比目標的信息是不恰當的;
  • 在各個層直接預測目標中心,降低關鍵點匹配難度;

效果: 我們的架構在MS COCO上實現了47.8的mAP,這比任何其他單次檢測器都高,同時使用的參數數量僅爲一半,並且訓練速度比次佳架構快3倍

&Research Objective

切入點: 考慮了CNN特徵size與aspect對目標檢測帶來的影響,因而擴大了特徵空間使得檢測網絡的性能得以提升。

該通過在網絡結構的不同層中找到匹配目標的不同size與aspect ratio從而提升檢測性能,而這些單獨的網絡層中size與aspect ratio是統一的,也就是檢測網絡會選擇最適合目標的特徵層來檢測目標,這樣就具有了很好的尺度與長寬比例魯棒性。使用這個機制這篇文章的算法在MS COCO數據集上獲得了47.8%的mAP,而且參數量自由一半,訓練速度快了3倍。

&Problem Statement

xNets 主要緩解了以下兩個問題:

  • 使用正方形的 Kernel 來提取不同寬高比目標的信息是不恰當的;
  • 在各個層直接預測目標中心,降低關鍵點匹配難度;

&Method(s)

作者提出的算法結構大致如下圖所示,對角線上的部分組成的是網絡其結構就是FPN結構,在多角線的每個節點上回橫向和縱向延伸(分別對應不同的寬高比例),從而構建了一了類似矩形的結構。
xNets 可以解決訓練過程中目標寬高比不同的問題。xNets 將不同寬高比的目標輸入到各個層,使目標經過該層之後寬高比接近於1。
在這裏插入圖片描述
在這篇論文中,xNet 用於基於關鍵點的目標檢測就構成了 KP-xNet 。
如下圖所示,KP-xNet 包含 4 個步驟。

  • (a-b) 步驟使用了 xNets 主幹;
  • (c) 步驟使用了共享輸出子網絡,而針對每個矩陣層,他們預測了左上角和右下角的熱圖、中心點、偏移量;
  • (d)步驟利用中心點預測匹配同一層中的角,然後將所有層的輸出與 soft 非極大值抑制結合,從而得到最終輸出。

在這裏插入圖片描述

&Evaluation

以前性能最好的是 CenterNet,它在 COCO 數據集上能獲得 47.0 的 mAP,但是 KP-xNet 只需要一半的參數量、1/3 的迭代數量、1/2 的 GPU 內存,就能獲得額外 5.7% mAP 的效果提升。
在這裏插入圖片描述

&Conclusion

介紹了MatrixNet,這是一種用於對象檢測的比例和長寬比感知體系結構。 作者展示瞭如何使用MatrixNets解決關鍵點對象檢測的基本限制。 模型在單發檢測器中達到了MS COCO的最新精度。

Thinks

  • 各個長寬比的魯棒性對精度的提升有效果。也就說,每個層的目標大小的長寬比都各不一樣,特定的層僅僅是適用於一種或幾種長寬比的目標檢測,就類似於大小目標而言,大目標在高層,小目標在底層。所以讓每個層來單獨對一種或幾種長寬比來檢測,這樣是不是就會提高呢??
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章