CCNet_Criss-Cross Attention for Semantic Segmentation

原創

2020-05-25 11:13

0. 寫作目的

好記性不如爛筆頭。

1. 主要思路

目前的self-attention需要生成 N * N 的affinity 矩陣（其中N = H * W），作者提出存在一種更有效的方法？

因此作者提出了 Criss-Cross attention，使用“十字架” 的結構來代替所有的位置(感覺使用“十字架”的paper很多，比如GCN使用十字街的conv，SPNet使用“十字架”的Pooling)。然後使用兩次 criss-cross attention，這樣可以綜合全部的空間信息。

2. 模型具體細節

reduction 先將使用3*3conv將channel降低爲輸入channel 的1/4.

然後加入在兩層 Criss-cross Attention Module之後，然後使用3*3conv進行refine一下得到H‘’，然後與X 進行concat，

然後使用3*3conv + BN + dropuout + 1*1Conv輸出結果（這裏輸出的是下采樣的結果）。

作者這裏也使用了輔助loss，在layer3 加入了輔助loss，權重爲0.4。

criss-cross attention module細節：

其中，Q， K 1*1得到的channel 爲輸出channel的1/8，V 的channel與輸入channel相同。

3. 實驗結果

注：文中圖片來自於paper。

There may be some mistakes in this blog. So, any suggestions and comments are welcome!

[Reference]

1. paper: https://arxiv.org/pdf/1811.11721.pdf

2. code: https://github.com/speedinghzl/CCNet

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

2020-07-03 CVPR2020 i3DV論文討論（2）筆記

目錄[1] Context Prior for Scene Segmentation[2] Deep Stereo using Adaptive Thin Volume Representation with Uncertaint

2020-07-04 09:51:10

2020-07-06 組會筆記

目錄賈老師賈老師利他主義很重要學習狀態，自律清華兩篇博士論文，有思想，有深度優博名額5%->10%，今年有2.5個名額

2020-07-06 14:22:03

2020-07-02 CVPR2020 V&L論文討論（3）筆記

目錄[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation[2] A Real-Time Cross-modality

2020-07-04 10:30:59

2020-06-18 CVPR2020 V&L論文討論（1）筆記

目錄CC JJY S[1] Normalized and Geometry-Aware Self-Attention Network for Image Captioning[2] Cops-Ref: A new Dataset

2020-07-04 10:30:59

2020-07-01 CVPR2020 表示學習論文討論（2）筆記

目錄[1] CVPR2020_A Unified Optimization Framework for Low-Rank Inducing Penaltie[2] CVPR2020_Automatic Neural Network

2020-07-04 09:51:10

Simple and Scalable Predictive Uncertainty Estimation using Deep Ensembles

普通的機器學習分類迴歸問題都是點估計，即模型給出的輸出是一個real value，或者是各個類別的probability。但是模型對於不同點的估計，確信度應該是不同的。對於和以往出現過樣本非常相似的點，給出的預測確信度比較高，對於和以往

2020-07-02 09:52:41

Paper Reading: WGAN & WGAN-gp

Paper Reading Note URL: Towards Principled Methods for Training Generative Adversarial Networks Wasserstein GAN T

2020-06-29 07:25:18

Adaptive Cross-Modal Few-shot Learning

論文資料1 基於度量的元學習（metric-based meta-learning）如今已成爲少樣本學習研究過程中被廣泛應用的一個範式。這篇文章提出利用交叉模態信息（cross-modal information）來進一步加強現有的度量

2020-06-28 22:43:10

Cross Attention Network for Few-shot Classification

作者：一顆檸檬味的橙子鏈接：https://zhuanlan.zhihu.com/p/105717426 來源：知乎著作權歸作者所有。商業轉載請聯繫作者獲得授權，非商業轉載請註明出處。來源：NeurIPS 2019 文章題目：C

2020-06-28 22:43:10

深度學習論文: LRNnet: a light-weighted network for real-time semantic segmentation及其PyTorch實現

深度學習論文: LRNnet: a light-weighted network with efficient reduced non-local operation for real-time semantic segmenta

2020-07-07 17:00:19

深度學習論文: Pyramidal Convolution: Rethinking CNN for Visual Recognition及其PyTorch實現

深度學習論文: Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition及其PyTorch實現 Pyramidal

2020-07-07 17:00:17

Delve into FastFCN:Rethinking Dilated Convolution in the backbone for Semantic Segmentation

1. What is the contribution of this paper? This paper proposed joint unsampling module named Joint Pyramid Upsampli

2020-07-03 09:47:36

[SDS]Simultaneous Detection and Segmentation

Motivation 作者認爲，儘管檢測和分割被分成兩個任務，但是這些差異都是人爲設定的。因此，這裏應該存在一種任務——Simultaneous Detection and Segmentation，這個其實就是後來的instan

2020-07-01 05:16:16

[SDN]Stacked Deconvolutional Network for Semantic Segmentation

Abstract 暫時還放在arxiv上，沒有出版.中科院自動化所模式匹配國重的文章. 在本文看來，語義分割存在的主要問題是分辨率的降低導致物體細節和小物體損失，現在的很多方法都是致力於如何更好提高分辨率.本文於是提出了Stac

2020-07-01 05:16:16

[論文筆記]Predicting Deeper into the Future of Semantic Segmentation

引介 ICCV2017的文章，arXiv:1703.07684 [cs.CV]，本文有LeCun的署名. Abstract 預測接下來視頻幀的單純的RGB像素值已經被研究了很久，本文提出了一種新奇的任務——預測接下來的視頻幀的語義

2020-07-01 05:16:16

24小時熱門文章

最新文章

最新評論文章