非極大值抑制(NMS)簡介
在目標檢測中,我們可以利用非極大值抑制對生成的大量候選框進行後處理,去除冗餘的候選框,得到最具代表性的結果,以加快目標檢測的效率。
如下圖所示,消除多餘的候選框,找到最佳的bbox:
非極大值抑制(NMS)流程
首先,根據候選框的類別分類概率 進行排序:
- 先標記最大概率矩形框F是我們要保留下來的候選框。
- 從最大概率矩形框F開始,分別判斷A~E與F的交併比(IOU)是否大於某個設定的閾值,假設B、D與F的重疊度超過閾值,那麼就去除B、D。
- 從剩下的矩形框A、C、E中,選擇概率最大的E,標記爲要保留下來的候選框,然後判斷E與A、C的重疊度,去除重疊度超過設定閾值的矩形框。
就這樣重複下去,直到剩下的矩形框沒有了,並標記所有要保留下來的矩形框。
import numpy as np
def py_cpu_nms(dets, thresh):
x1 = dets[:, 0]
y1 = dets[:, 1]
x2 = dets[:, 2]
y2 = dets[:, 3]
scores = dets[:, 4]
areas = (x2 - x1 + 1) * (y2 - y1 + 1)
order = scores.argsort()[::-1]
keep = []
while order.size > 0:
i = order[0]
keep.append(i)
xx1 = np.maximum(x1[i], x1[order[1:]])
yy1 = np.maximum(y1[i], y1[order[1:]])
xx2 = np.minimum(x2[i], x2[order[1:]])
yy2 = np.minimum(y2[i], y2[order[1:]])
w = np.maximum(0.0, xx2 - xx1 + 1)
h = np.maximum(0.0, yy2 - yy1 + 1)
inter = w * h
ovr = inter / (areas[i] + areas[order[1:]] - inter)
inds = np.where(ovr <= thresh)[0]
order = order[inds + 1]
return keep