接上面部分,對五六七部分進行詳解,這篇介紹第七部分。
一、回顧
第七部分進行最後的後處理:
results = self.merge_outputs(detections)
torch.cuda.synchronize()
end_time = time.time()
merge_time += end_time - post_process_time
tot_time += end_time - start_time
merge_outputs在ctdet.py中
二、詳解
merge_outputs在ctdet.py中:
def merge_outputs(self, detections):
# 輸入的detections是一個列表,圖片(某一張)的不同尺度對應不同元素,每個元素是一個len=80的列表,包含det和score的信息
results = {}
# 對於第j類
for j in range(1, self.num_classes + 1):
# results[j]保存所有圖片中第j類的dets,彙總不同尺度的dets
results[j] = np.concatenate(
[detection[j] for detection in detections], axis=0).astype(np.float32)
# 可以進行一波nms,讓不同尺度獲得的dets篩選
if len(self.scales) > 1 or self.opt.nms:
soft_nms(results[j], Nt=0.5, method=2)
# scores是(100, )的ndarray
scores = np.hstack(
[results[j][:, 4] for j in range(1, self.num_classes + 1)])
if len(scores) > self.max_per_image:
kth = len(scores) - self.max_per_image
thresh = np.partition(scores, kth)[kth]
for j in range(1, self.num_classes + 1):
keep_inds = (results[j][:, 4] >= thresh)
results[j] = results[j][keep_inds]
return results
最後獲得的results是 80個元素的dict,包含各個類別的dets和scores。