Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection (2)

Feature backbone採用DLA,輸入維度爲3×H×W的RGB圖,得到維度D×h×w的特徵圖F,然後將特徵圖送入幾個輕量級regression heads,2D bouding boxes的中心特徵圖用下面的模塊得到:

其中AN是Attentive Normalization.用公式表示:

類似的, 2D和3D bouding boxes的中心之間的offset用公式表示:

深度用以下兩個公式表示:

其中Z是預測的深度值,delta是標準差.

3D bouding boxes的維度用以下公式表示:

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章