原创 CAP:多重注意力機制,有趣的細粒度分類方案 | AAAI 2021

論文提出細粒度分類解決方案CAP,通過上下文感知的注意力機制來幫助模型發現細微的特徵變化。除了像素級別的注意力機制,還有區域級別的注意力機制以及局部特徵編碼方法,與以往的視覺方案很不同,值得一看 來源:曉飛的算法工程筆記 公衆號 論文:

原创 NF-ResNet:去掉BN歸一化,值得細讀的網絡信號分析 | ICLR 2021

論文提出NF-ResNet,根據網絡的實際信號傳遞進行分析,模擬BatchNorm在均值和方差傳遞上的表現,進而代替BatchNorm。論文實驗和分析十分足,出來的效果也很不錯。一些初始化方法的理論效果是對的,但實際使用會有偏差,論文通過

原创 Involution:空間不共享?可完全替代卷積的高性能算子 | CVPR 2021

其實這篇文章很早就寫好了,但作者其它論文涉及到洗稿問題,所以先放着了。目前看這篇文章沒被舉報有洗稿的嫌疑,所以就發出來了 . 來源:曉飛的算法工程筆記 公衆號 論文: Involution: Inverting the Inherenc

原创 MobileNext:打破常規,依圖逆向改造inverted residual block | ECCV 2020

論文深入分析了inverted residual block的設計理念和缺點,提出更適合輕量級網絡的sandglass block,基於該結構搭建的MobileNext。根據論文的實驗結果,MobileNext在參數量、計算量和準確率上都

原创 GFLV2:邊界框不確定性的進一步融合,提點神器 | CVPR 2021

  GFLV2基於GFLV1的bbox分佈進行改進,將分佈的統計信息融入到定位質量估計中,整體思想十分創新和完備,從實驗結果來看,效果還是挺不錯的 來源:曉飛的算法工程筆記 公衆號 論文: Generalized Focal Loss

原创 DynamicHead:基於像素級路由機制的動態FPN | NIPS 2020

論文提出了細粒度動態detection head,能夠基於路由機制動態地融合不同FPN層的像素級局部特徵進行更好的特徵表達。從設計的路由空間來看是一個十分耗時的操作,但是作者設計的高效路由器實際計算十分高效。實驗結果來看,細粒度動態det

原创 RepVGG:VGG,永遠的神! | CVPR 2021

RepVGG將訓練推理網絡結構進行獨立設計,在訓練時使用高精度的多分支網絡學習權值,在推理時使用低延遲的單分支網絡,然後通過結構重參數化將多分支網絡的權值轉移到單分支網絡。RepVGG性能達到了SOTA,思路簡單新穎,相信可以在上面做更多

原创 ReLabel:自動將ImageNet轉化成多標籤數據集,更準確地有監督訓練 | 2021新文

人工標註數據集中普遍存在噪聲,ReLabel能夠自動且低成本地將原本的單標籤數據集轉化爲多標籤數據集,並且提出配合random crop使用的高效LabelPooling方法,能夠更準確地指導分類網絡的訓練   來源:曉飛的算法工程筆記

原创 MicroNet: 低秩近似分解卷積以及超強激活函數,碾壓MobileNet | 2020新文分析

論文提出應對極低計算量場景的輕量級網絡MicroNet,包含兩個核心思路Micro-Factorized convolution和Dynamic Shift-Max,Micro-Factorized convolution通過低秩近似將原

原创 RepLKNet:不是大卷積不好,而是卷積不夠大,31x31卷積瞭解一下 | CVPR 2022

論文提出引入少數超大卷積核層來有效地擴大有效感受域,拉近了CNN網絡與ViT網絡之間的差距,特別是下游任務中的性能。整篇論文闡述十分詳細,而且也優化了實際運行的表現,值得讀一讀、試一試   來源:曉飛的算法工程筆記 公衆號 論文: Sc

原创 FPT:又是借鑑Transformer,這次多方向融合特徵金字塔 | ECCV 2020

論文提出用於特徵金字塔的高效特徵交互方法FPT,包含3種精心設計的特徵增強操作,分別用於借鑑層內特徵進行增強、借鑑高層特徵進行增強以及借鑑低層特徵進行增強,FPT的輸出維度與輸入一致,能夠自由嵌入到各種包含特徵金字塔的檢測算法中,從實驗結

原创 Non-local Network:人類早期在CV馴服Transformer嘗試 | CVPR 2018

Non-local操作是早期self-attention在視覺任務上的嘗試,核心在於依照相似度加權其它特徵對當前特徵進行增強,實現方式十分簡潔,爲後續的很多相關研究提供了參考   來源:曉飛的算法工程筆記 公衆號 論文: Non-loc

原创 Anchor-free目標檢測綜述 -- Keypoint-based篇

  早期目標檢測研究以anchor-based爲主,設定初始anchor,預測anchor的修正值,分爲two-stage目標檢測與one-stage目標檢測,分別以Faster R-CNN和SSD作爲代表。後來,有研究者覺得初始ancho

原创 Anchor-free目標檢測綜述 -- Dense Prediction篇

  早期目標檢測研究以anchor-based爲主,設定初始anchor,預測anchor的修正值,分爲two-stage目標檢測與one-stage目標檢測,分別以Faster R-CNN和SSD作爲代表。後來,有研究者覺得初始ancho

原创 RelationNet++:基於Transformer融合多種檢測目標的表示方式 | NeurIPS 2020

論文提出了基於注意力的BVR模塊,能夠融合預測框、中心點和角點三種目標表示方式,並且能夠無縫地嵌入到各種目標檢測算法中,帶來不錯的收益   來源:曉飛的算法工程筆記 公衆號 論文: RelationNet++: Bridging Vis