PSPNet_ Pyramid Scene Parsing Network

原創

2020-05-06 03:16

0. 寫作目的

好記性不如爛筆頭。

1. 問題

ADE20K 數據集存在的一些問題：

1，錯分：圖2第一行，船被誤分爲車了。如果使用了全局信息，則可以避免這種情況。

2。迷惑的類別：第二行，建築和摩天大樓。

3。不易區分的類別：枕頭

2. 解決方法

融合全局信息提高分割結果

2.1 模型

模型：

其中（b）feature map得到的是在採樣8倍的特徵。

然後通過average pooling得到 1*1， 2*2， 3*3和 6*6的特徵圖，然後使用1*1conv 對特徵圖壓縮通道，壓縮爲原來通道的 1/N，其中N爲 pool的個數，這裏爲4。

再對不同的pool結果進行上採樣，然後與 feature進行 concate。再使用conv得到最終的結果。

2.2 輔助loss

同時，訓練時，添加來一個輔助loss，這個方式與 BiSeNet v1 的操作相似。，該輔助loss 的權重爲0.4，是通過實驗得到的。

輔助loss權重的實驗：

3.3 實驗結果

實驗效果很不錯，提高mIOU較多。

增大backbone效果更好：

與其他方法對比：

There may be some mistakes in this blog. So, any suggestions and comments are welcome!

注：文中圖來源於paper。

[Reference]

paper: https://arxiv.org/abs/1612.01105

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

2020-07-03 CVPR2020 i3DV論文討論（2）筆記

目錄[1] Context Prior for Scene Segmentation[2] Deep Stereo using Adaptive Thin Volume Representation with Uncertaint

2020-07-04 09:51:10

2020-07-06 組會筆記

目錄賈老師賈老師利他主義很重要學習狀態，自律清華兩篇博士論文，有思想，有深度優博名額5%->10%，今年有2.5個名額

2020-07-06 14:22:03

2020-07-02 CVPR2020 V&L論文討論（3）筆記

目錄[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation[2] A Real-Time Cross-modality

2020-07-04 10:30:59

2020-06-18 CVPR2020 V&L論文討論（1）筆記

目錄CC JJY S[1] Normalized and Geometry-Aware Self-Attention Network for Image Captioning[2] Cops-Ref: A new Dataset

2020-07-04 10:30:59

2020-07-01 CVPR2020 表示學習論文討論（2）筆記

目錄[1] CVPR2020_A Unified Optimization Framework for Low-Rank Inducing Penaltie[2] CVPR2020_Automatic Neural Network

2020-07-04 09:51:10

Simple and Scalable Predictive Uncertainty Estimation using Deep Ensembles

普通的機器學習分類迴歸問題都是點估計，即模型給出的輸出是一個real value，或者是各個類別的probability。但是模型對於不同點的估計，確信度應該是不同的。對於和以往出現過樣本非常相似的點，給出的預測確信度比較高，對於和以往

2020-07-02 09:52:41

Paper Reading: WGAN & WGAN-gp

Paper Reading Note URL: Towards Principled Methods for Training Generative Adversarial Networks Wasserstein GAN T

2020-06-29 07:25:18

Adaptive Cross-Modal Few-shot Learning

論文資料1 基於度量的元學習（metric-based meta-learning）如今已成爲少樣本學習研究過程中被廣泛應用的一個範式。這篇文章提出利用交叉模態信息（cross-modal information）來進一步加強現有的度量

2020-06-28 22:43:10

Cross Attention Network for Few-shot Classification

作者：一顆檸檬味的橙子鏈接：https://zhuanlan.zhihu.com/p/105717426 來源：知乎著作權歸作者所有。商業轉載請聯繫作者獲得授權，非商業轉載請註明出處。來源：NeurIPS 2019 文章題目：C

2020-06-28 22:43:10

深度學習論文: LRNnet: a light-weighted network for real-time semantic segmentation及其PyTorch實現

深度學習論文: LRNnet: a light-weighted network with efficient reduced non-local operation for real-time semantic segmenta

2020-07-07 17:00:19

深度學習論文: Pyramidal Convolution: Rethinking CNN for Visual Recognition及其PyTorch實現

深度學習論文: Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition及其PyTorch實現 Pyramidal

2020-07-07 17:00:17

Delve into FastFCN:Rethinking Dilated Convolution in the backbone for Semantic Segmentation

1. What is the contribution of this paper? This paper proposed joint unsampling module named Joint Pyramid Upsampli

2020-07-03 09:47:36

[SDS]Simultaneous Detection and Segmentation

Motivation 作者認爲，儘管檢測和分割被分成兩個任務，但是這些差異都是人爲設定的。因此，這裏應該存在一種任務——Simultaneous Detection and Segmentation，這個其實就是後來的instan

2020-07-01 05:16:16

[SDN]Stacked Deconvolutional Network for Semantic Segmentation

Abstract 暫時還放在arxiv上，沒有出版.中科院自動化所模式匹配國重的文章. 在本文看來，語義分割存在的主要問題是分辨率的降低導致物體細節和小物體損失，現在的很多方法都是致力於如何更好提高分辨率.本文於是提出了Stac

2020-07-01 05:16:16

[論文筆記]Predicting Deeper into the Future of Semantic Segmentation

引介 ICCV2017的文章，arXiv:1703.07684 [cs.CV]，本文有LeCun的署名. Abstract 預測接下來視頻幀的單純的RGB像素值已經被研究了很久，本文提出了一種新奇的任務——預測接下來的視頻幀的語義

2020-07-01 05:16:16

24小時熱門文章

最新文章

最新評論文章