爲什麼輸入尺度416*416:經過下采樣得到13*13,有中心點,作者發現大目標中心經常在中心點上,而448*448經過卷積得到
14*14無中心點。
深度詳解,爲什麼是255深度
實際上是3個bbox
每個85深度包含:(x,y,w,h,s,cls1_s,cls2_s....,cls80_s)s代表有沒有物體的機率,cls_s代表爲每一類的概率
結構圖
類fpn結構 ,concat各個大小的feature map
yolov3一次產生共多少bbox?
3*13*13+
3*26*26+
3*52*52=10647
之後經過s的值篩選+non—maximum篩選
每個bbox向量裏有什麼?以及運算的過程
1。長度的含義
probj:有沒有物體
2.第二步 找出最大的cls值(藍色的)
3第三步,將Pr_obj和Pr_max_cls相乘,得到的值更新到PR_obj的位置
4第四步,刪掉score小於conf_thres的,然後排序,最後做非極大值抑制
loss對比(v1和v3)