在目標檢測當中,有一個重要的概念就是 IOU。一般指代模型預測的 bbox 和 Groud Truth 之間的交併比。
何爲交併比呢?
IOU = \frac{A\cap B}{A\cup B}IOU=A∪BA∩B
集合 A 和集合 B 的並集包括了上面 3 種顏色區域。
集合 C 是集合 A 與集合 B 的交集。
在目標檢測當中,IOU 就是上面兩種集合的比值。
A \cup BA∪B 其實就是 A + B - CA+B−C。
那麼公式可以轉變爲:
IOU = \frac{A \cap B}{A + B - (A \cap B)}IOU=A+B−(A∩B)A∩B
IOU 衡量兩個集合的重疊程度。
- IOU 爲 0 時,兩個框不重疊,沒有交集。
- IOU 爲 1 時,兩個框完全重疊。
- IOU 取值爲 0 ~ 1 之間的值時,代表了兩個框的重疊程度,數值越高,重疊程度越高。
在 2D 目標檢測當中,因爲 bbox 是矩形,所以很容易求得 IOU。
方框 A 和 B 相交,典型的情況如下:
A 和 B 的面積容易求得,C 的面積稍微繁瑣一點,但耐心細緻的話可以求得。
如果利用數學思維,細心整理,可以發現面積 C 只需要求得邊長的乘積就好,即使 A 和 B 的位置是相對的,但稍加變換也能夠求出。
如果以 W 代表 A 和 B 的交集 C 的 x 軸方向上的邊長,那麼有
W = min(A.x_{1},B.x_{1}) - max(A.x_{0},B.x_{0})W=min(A.x1,B.x1)−max(A.x0,B.x0)
同理,
H = min(A.y_{1},B.y_{1}) - max(A.y_{0},B.y_{0})H=min(A.y1,B.y1)−max(A.y0,B.y0)
大家仔細觀察上面的對應關係,可以發現公式是成立的。這個公式的推導並不難,無非是 4 個頂點的座標的相對位置變換,大家可以自行琢磨。
如果 A 與 B 根本就不相交。
這個時候可以發現 W <= 0 或 H <= 0.
下面是 Python 代碼。
class BBox:
def __init__(self,x,y,w,h):
self.x = x
self.y = y
self.w = w
self.h = h
def iou(a,b):
assert isinstance(a,BBox)
assert isinstance(b,BBox)
area_a = a.w * a.h
area_b = b.w * b.h
w = min(b.x+b.w,a.x+a.w) - max(a.x,b.x)
h = min(b.y+b.h,a.y+a.h) - max(a.y,b.y)
if w <= 0 or h <= 0:
return 0
area_c = w * h
return area_c / (area_a + area_b - area_c)
if __name__ == '__main__':
a = BBox(1,1,4,5)
b1 = BBox(1,1,4,5)
b2 = BBox(5,1,4,5)
b3 = BBox(3,2,3,6)
print("iou ",iou(a,b1))
print("iou ",iou(a,b2))
print("iou ",iou(a,b3))
運行結果如下:
iou 1.0
iou 0
iou 0.26666666666666666
再加上個DIOU 等等吧
還有GIOU相比iou的優點 哈哈