【論文閱讀】【三維目標檢測】3DSSD: Point-based 3D Single Stage Object Detector

香港中文大學,香港科技大學出品,賈佳亞團隊
2020CVPR

3DSSD

F-FPS

這是我認爲本文最重要的一個貢獻,該貢獻解決了前景點採樣點(representative points)少的問題。解決方式也很巧妙,在FPS的過程中,除了使用點與點之間的距離,還加入了feature與feature的距離。該方式的加入使得采樣點中前景點的數量更多了。具體效果也在Table 2中做了比較。

值得注意的一點是,作者並沒有完全使用F-FPS,而是使用了D-FPS與F-FPS的結合,兩者均取一些點,然後將兩者採樣的點合起來。這樣做是爲了在訓練過程中引入足夠的負樣本。

Framework

如果讀過VoteNet這篇論文,可以發現CG Layer與VoteNet中的很像。VoteNet的詳細解讀可以參考我的另外兩篇博客[1][2]

Loss中也是與VoteNet很像,新的部分是使用了center-ness score,center-ness score文中說是參考了2D Object Detection中FCOS。如果看FCOS,可以看到這個的center-ness score與FCOS中的確實很像,只不過是由2維度變成了3維。

Experiment

在KITTI和nuScenes數據集上都做了實驗,效果還不錯

Ablation Study分別驗證了

  • F-FPS與D-FPS結合的有效性
  • CG Layer的有效性
  • Center-ness score的有效性
  • 計算時間上的優勢

問題:

1、由於還是FPS,儘管加入了feature空間,還是相當於對(位置+feature)空間內全體的採樣,也就是說在預測時,還有很多背景點。
2、Figure. 3沒有詳細解釋,通道數對不上啊。例如左圖,第一次下采樣過後的點的feature的通道數不應該是(64+128+128)嗎?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章