根據MTCNN中P網絡的輸出，反算到原圖中畫框

原創

燕小硕

2020-06-22 02:25

根據MTCNN中P網絡的輸出，反算到原圖中畫框

上一篇博文，通過P網絡的輸出，經過一系列比較複雜的工作，得到了我們想要的[_x1,_y1,_x2,_y2,C]，_x1,_y1,_x2,_y2是四個偏移量，C是置信度，下面介紹如何反算到原圖畫框。

start_index是索引
offset是偏移量
cls是置信度
scale是縮放尺寸
stride是步長，MTCNN中步長是固定的
因爲在做圖像金字塔的時候，對原圖乘以了一個scale，所以在反算的時候要除以scale

 # 將回歸量還原到原圖上去
    def __box(self, start_index, offset, cls, scale, stride=2, side_len=12):

        _x1 = (start_index[1] * stride) / scale
        _y1 = (start_index[0] * stride) / scale
        _x2 = (start_index[1] * stride + side_len) / scale
        _y2 = (start_index[0] * stride + side_len) / scale

        ow = _x2 - _x1
        oh = _y2 - _y1

        _offset = offset[:, start_index[0], start_index[1]]
        x1 = _x1 + ow * _offset[0]
        y1 = _y1 + oh * _offset[1]
        x2 = _x2 + ow * _offset[2]
        y2 = _y2 + oh * _offset[3]

        return [x1, y1, x2, y2, cls]

x1 = _x1 + ow * _offset[0]
y1 = _y1 + oh * _offset[1]
x2 = _x2 + ow * _offset[2]
y2 = _y2 + oh * _offset[3]
上面的公式是這麼回事：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

根據MTCNN中P網絡的輸出，反算到原圖中畫框

根據MTCNN中P網絡的輸出，反算到原圖中畫框

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

卷積、池化後特徵圖大小計算公式

python中.flush()意思

MTCNN中celebA數據集的處理（一個置信度，兩個座標點）

MTCNN中非極大值抑制NMS代碼

python中.copy()的用法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結