與2D目標跟蹤類似,3D目標跟蹤可以分爲單目標跟蹤和多目標跟蹤,首先介紹單目標跟蹤(SOT)算法的常用評估指標;其次介紹多目標跟蹤(MOT)算法的常用評估指標。
單目標跟蹤
傳統的評估tracker的方式是:在測試序列上運行一遍該跟蹤算法(其中第一幀以ground truth作初始化),然後計算average precision或sucess rate。我們把這種只在測試序列上運行一遍的評估方法叫做one-pass evaluation (OPE)。然而tracker對初始化可能比較敏感,不同的起始幀可能對performance有很大的影響。因此,還需要對算法的魯棒性進行評估,包括時間魯棒性評估(TRE)和空間魯棒性評估(SRE)。接下來詳細介紹OPE和Robustness的評估指標。
ALE(Average Location Error)
- 定義:平均定位誤差,即預測框與真實框中心位置的歐式距離取幀平均
- 用途:用來判斷兩個框的靠近程度
AOR(Average Overlap Rate)
Overlap Rate threshold
- 定義:平均重疊率,即預測的b-box與ground truth的交併比取幀平均
- 範圍:0~100%
- 用途:用來判斷兩個框的重疊程度
-
Location Error threshold
- 定義:需要人爲設定的定位誤差的閾值,Location Error低於該閾值的框被認爲是命中目標,反之則被認爲未命中
- 用途:作爲區分框是否命中目標的指標
- 定義:需要人爲設定的重疊率的閾值,重疊率高於該閾值的框被認爲是命中目標,反之則被認爲未命中
- 範圍:0~100%
- 用途:作爲區分框是否命中目標的指標
Precision plot
- 定義:選取不同的Location Error threshold,得到各閾值下的precision,連接各點形成precision曲線
- 用途:根據曲線下的面積或者某個threshold下的precision,來衡量tracker的跟蹤準確度。
Success plot
- 定義:選取不同的Overlap Rate threshold,重疊率大於閾值視爲跟蹤成功,序列中跟蹤成功的幀數佔總幀數的比例定義爲跟蹤成功率,則可以得到各閾值下的成功率,連接各點形成success曲線
- 用途:根據曲線下的面積來衡量tracker的跟蹤精確度
TRE(Temporal Robustness Evaluation)
- 定義:時間魯棒性評估。從整個序列中截取若干段(可以重複),每段的初始幀利用ground truth進行初始化,在每一段上分別運行跟蹤算法,對每一段分別進行評估,最後對總體信息進行統計。
SRE(Spatial Robustness Evaluation)
- 定義:空間魯棒性評估。對起始幀的ground truth進行shift或scale操作形成若干段測試序列,在每一段上分別運行跟蹤算法,對每一段分別進行評估,最後對總體信息進行統計
多目標跟蹤
在2D 目標跟蹤中介紹了MOTP、MOTA、MT、ML、FM等2D MOT評估指標,這些指標對於3D MOT同樣適用,只是在3D場景下需要將3D IoU作爲衡量假設與目標是否匹配的標準。
然而,使用單個閾值進行評估無法反映出accuracy和precision的全部範圍。換句話說,僅在單個閾值處獲得高MOTA值而在其他閾值處獲得極低MOTA值的MOT系統在單一閾值的評估標準下仍然可能脫穎而出。但理想情況下,研究人員應繼續開發MOT系統,以在所有閾值上實現儘可能高的MOTA。
爲了解決這個問題,在3D MOT中,論文提出了兩個新的評估指標:AMOTA和AMOTP,總結所有閾值上的MOTA和MOTP,而不是使用單個閾值。與目標檢測的平均精度AP相似,通過將MOTA和MOTP在recall曲線下積分,可以計算出AMOTA和AMOTP。爲了簡化計算,可以使用插入法來近似積分。
AMOTA(Average Multiple Object Tracking Accuracy)
- 定義:多目標跟蹤平均準確度。選取不同的閾值,得到不同閾值下的recall和MOTA,以recall爲橫座標、MOTA爲縱座標,繪製出MOTA-recall曲線,使用插入法求取MOTA的均值,即AMOTA。
- 用途:用來評估跟蹤算法在所有閾值下的總體準確度表現,以提高算法健壯性
AMOTP(Average Multiple Object Tracking Precision)
- 定義:多目標跟蹤平均精度。選取不同的閾值,得到不同閾值下的recall和MOTP,以recall爲橫座標、MOTP爲縱座標,繪製出MOTP-recall曲線,使用插入法求取MOTP的均值,即AMOTP。
- 用途:用來評估跟蹤算法在所有閾值下的總體精度表現,以提高算法健壯性