efficientdet問答

EfficientDet: Scalable and Efficient Object Detection

https://arxiv.org/abs/1911.09070

1.文章採用了哪些主要優化方法,提高性能

  1)使用bifpn, 2)使用了複合縮放辦法,,對主幹、特徵網絡、方框/分類預測網絡一致的縮放:尺度、深度、寬度

2.什麼是一階段的目標檢測?

  直接基於anchor預測,不產生proposal network,例如ssd

3.什麼是anchor-free的目標檢測?

   不用anchor, 直接回歸物體的定點

4.efficientdet是否開源了語義檢測部分,論文中提到比deeplabv3+,更準,但是參數少了9.8倍?

    沒有開源

5.傳統自頂向下的fpn,信息流是單向的,怎麼解釋?

  這裏應該指從主幹出來的特徵層,組成的網絡

6.biFPN 首先去掉了PANET的單輸入節點,然後同一個尺度的特徵,加入了直連, 請問PANET中有哪些是單輸入節點?  

   P7後面的節點,以及P3後面的後面的節點

7. biFPN中加入權值的特徵融合,是w0 x0 + w1 x1的方式嗎?w的取值範圍是多少?

  不是,因爲這樣w取值範圍很大,訓練很不穩定; w>=0,使用了relu

   使用softmax方式,運算量很大,所以採用了w0/(w0+w1)的方式歸一化

8.使用efficientdet 裏面深度等計算公式,計算b0, b7的 寬度,深度,尺度的縮放係數?

  B0:  寬度縮放係數64, 深度縮放係數3, 類別/方框層數係數 3, 輸入尺度512

  B6: 通道數係數64*1.35^6=387 384, 網絡層數3+6=9  8, 類別/方框層數3+6/2 = 6  5 輸入 512+6*128 = 1280

9.什麼是學習率,的餘弦衰減

 10. 什麼是focal loss?

  11. b0 和yolov3 的準確度和性能對比如何?

  準確度差不多,b0比yolov3 少28倍

12. efficientdet用於物體檢測用了哪些特徵層, 做語義分割用了哪些層?

   p3-p7, p2-p7

13.什麼是深度可分離卷積?

  可分離指的是對輸入特徵,逐通道做一個卷積,所以輸出通道等於輸入通道,最後用1x1卷積,融合多個通道特徵,並改變輸出通道數。

   

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章