ACNet_ Adaptive Context Network for Scene Parsing

0. 写作目的

    好记性不如烂笔头。

1.  主要思想

    在feature 中对于全局上下文和局部上下文引入不同的权重。

(个人感觉思想上,cvpr2020 中的 CPNet 引入同类和非同类的权重更好一些)

2. 模型的框架

    

GCM 和  LCM:

2.1 GCM 的细节

     主要思想是:计算全局特征p, [C, 1, 1],然后对于特征A 中的每一个位置计算距离,距离使用L2范式。依据最小的距离,和超参数derta,以及exp函数来构建特征A 中与全局信息最相近的global gate coefficient,即与全局信息越相近,则global gate coefficient的值越接近1。然后将该值与全局信息p相乘,同时加入一个因子a,将结果与特征A 中的每一个位置相加。(这里相加而不是concat,作者说是为了节省内存)

 

   

2.2 LCM的细节

   思想也是使用local gate coefficient与特征相乘。这里local gate coefficient是从 global gate coefficient 进行求反转得到的,即 1 - global。由于local gate 的分辨率大于global gate的分辨率,因此先对global gate使用线性上采样。 同时,作者通过实验发现,多次引入 local gate更有效,实验中使用的是三次,这里对于特征的融合使用的是concat,作者在引入local特征前先对特征降通道。

 

3. 实验结果

   实验细节: 作者也使用了辅助loss, backbone使用的是基于Dilated conv的 ResNet。 在测试时,使用了 multi-scale。

3.1 GCM 的实验,也实验了GCM中超参数derta

3.2 LCM的实验, 选择引入local gate coefficient的次数

3.3  ACB 引入的次数,因此融入其他测试策略的结果

3.4 与其他paper对比

 

There may be some mistakes in this blog. So, any suggestions and comments are welcome!

注: 文中图片来源于paper。

[Reference]

   ICCV2019 paper: https://arxiv.org/abs/1911.01664

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章