1 前言
CenterNet的代碼還是有點難懂,不過還是要感謝各位同學分享的資料~
2 CenterNet代碼的學習筆記
2.1 數據讀取——COCO類
COCO類是用來進行數據讀取的,讀取之後獲得的item有以下幾個屬性:
'image': img,
'hmap': hmap,
'w_h_': w_h_,
'regs': regs,
'inds': inds——
inds指的是目標中心的線式索引,其中“線式索引”指的是將單張特徵圖平鋪爲一維向量之後的索引(或者說座標),
從inds的計算公式也可以看出:inds[k] = obj_c_int[1] * self.fmap_size['w'] + obj_c_int[0]
'ind_masks': ind_masks,
'c': center, 's': scale, 'img_id': img_id
2.2 後處理
2.2.2 Soft-NMS——在測試階段對boxes進行過濾
CenterNet在測試階段時使用了Soft-NMS算法,
我覺得可能的原因是CenterNet在測試時將圖片建立了多尺度輸入,所以很可能會出現重複檢測框的情況,