目標檢測論文解讀:CenterNet: Keypoint Triplets for Object Detection

這篇也是2019的一篇anchor-free系列的one-stage目標檢測論文。碰巧的是和另一篇center net重名,而剛好那篇論文比較出名,所以這篇論文屬實比較慘,但是其實這篇論文的思想還是很簡介易懂,非常值得學習。
這篇論文可以說是CornerNet的改進,關於CornerNet,可以參考我之前寫的這篇解讀:https://blog.csdn.net/weixin_44629973/article/details/105188429

背景

在我看來,這篇論文其實就是將CornerNet檢測兩個角點變爲檢測兩個角點和一箇中心點,這是因爲算法對目標框較敏感,其embedding其實並不能很好的將屬於一組的角點連接在一起。
在這裏插入圖片描述
因此論文作者的想法是:將檢測兩個角點變成檢測兩個角點+一箇中心點,如果中心點在角點組成的bbox中才認爲檢測正確,中心點的檢測和檢測角點的值均有一定的創新。

流程

在這裏插入圖片描述
前面的backbone部分和cornernet完全相同,不再闡述。作者提出了cascade corner pooling替代原有的corner pooling,針對檢測中心點提出了corner pooling。

cascade corner pooling

原有的corner pooling是在兩個方向取最大值最後相加,這樣導致角點對邊緣特別敏感,而對於物體內部信息缺乏理解,所以導致後面的embedding做的並不出彩,爲了改善這一情況,cascade corner pooling先沿着邊界找到最大值,然後再向內尋找最大值,將內部最大值相加賦給原來的角點,這樣角點既有外部感知也有內部感知。
在這裏插入圖片描述

center pooling

如何找到center點?
找出目標兩個方向像素值最大的點即爲center
如何判斷center在bbox中?
首先確定這裏的bbox和平常的bbox不太一樣,因爲bbox的大小影響center的檢測問題。For example, smaller central regions lead to a low recall rate for small bounding boxes,while larger central regions lead to a low precision for large bounding boxes。因此設計出了不同尺度的bbox
在這裏插入圖片描述
對於邊框長*寬>22500使用n=3,>22500使用N=5
在這裏插入圖片描述

實驗結果

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章