FCOS3D是在2D檢測器FCOS的基礎上提出的,是一種單目3D檢測算法,根據RGB圖像進行3D目標檢測.FCOS預測的是一個前景點到邊界框的4個距離,而FCOS3D需要預測更多的東西,包括3D中心點,3D尺寸,以及目標的方向.
整體結構上,FCOS3D和FCOS非常類似,Backbone和Neck完全一致,區別在於Head,Classification,Centerness以及和3D相關的各種輸出都有自己獨立的Head.
損失函數較爲複雜,分類使用Focal Loss:
迴歸基本上使用SmoothL1 Loss,方向分類和Center-ness使用Binary Cross Entropy:
總的損失:
在nuScenes數據集上進行了測試: