16-Seed_expand_and_constrain Three_principles_for_weakly-supervised_image_segmentation

原創

2018-12-23 17:53

概括

Seeding Loss——對目標進行弱定位（weak localization）生成初始mask
Expansion Loss——對弱定位的mask進行合理的擴大
Constrain-to-boundary Loss——對擴大後的mask進行合理的約束，更貼近目標邊界
因此將該方法命名爲SEC（Seed + Expand + Constrain）

創新

圖像分類神經網絡，例如AlexNet 或VGG，可用於生成可靠的對象定位線索（種子），但無法預測對象的確切空間範圍。我們通過使用種子損失來結合這一方面，該種子損失鼓勵分割網絡匹配定位提示，但是對於圖像的其餘部分是不可知的。
爲了從每個圖像標註訓練分割網絡，可以使用全局池化層將分割mask聚合成圖像級標籤分數。該層的選擇對分割的質量有很大影響。例如，最大池化傾向於低估對象的大小，而平均池化往往會高估它。我們提出了一個全球加權等級池化，它通過擴展損失來利用，將對象種子擴展到合理規模的區域。它擴展了最大池化和平均池化，並在我們的實證研究中表現優於它們。
從圖像級標籤訓練的網絡很少捕獲圖像中對象的精確邊界。在測試時通過全連接條件隨機場（CRF）進行後處理通常不足以克服這種影響，因爲一旦網絡經過訓練，他們就會對錯誤分類的區域產生信心。我們提出了一種新的約束到邊界損失，可以在訓練時緩解不精確邊界的問題。它努力約束預測的分割mask以重視低級圖像信息，特別是對象邊界。

框架

Seeding loss

首先需要使用某種方法對圖像中的目標進行弱定位（weak localization），所謂的弱定位，就是通過圖像層面（image-level）的label對圖像中的目標進行定位。採用的主要方法爲CAM（Class Activation Mapping）—— Learning Deep Features for Discriminative Localization（CVPR 2016）
Seeding loss的流程及效果如圖2 所示，圖片中主要有兩個目標：person和cow（圖2 左），使用弱定位方法將兩個目標以及背景分別生成熱力圖（圖2 中），最後合成，生成這三類的初始位置信息（圖2 右）

Seeding loss定義如下：

其中 $f(X)$ 表示在圖像 $X$ 中，區域 $u$ 被預測爲類別 $c$ 的概率， $Sc$ 表示通過弱定位得到的那些被標註爲類別 $c$ 的區域由此式，seeding loss可以約束神經網絡，使其只關注那些高亮區域，而忽略剩餘區域，提高預測能力;

Expansion loss

由於Seeding loss生成的弱定位區域太小，沒有實用性，因此需要對其進行合理的擴大，而Expansion loss就是爲此而設計
爲了訓練一個圖像分割網絡，可以使用全局池化層，將卷積層得到的特徵圖（即segmentation mask）進行全局池化操作，得到對應的圖像層面的label得分
全局池化主要有兩種：
1. Global Max Pooling：只能使單個區域的響應較高，低估（underestimate）了目標的尺寸
2. Global Average Pooling：所有區域的響應都比較高，高估（overestimate）了目標的尺寸
爲了消除這些弊端，提出了GWAP（Global Weighted Rank Pooling）方法，對每個類別計算加權平均得分，對於那些可信度較高的區域（即更有可能是目標的區域），對應的權重就比較大，反之亦然
對於圖像X，類別爲c的GWRP定義如下：

其中dc是衰減係數
- 當dc=0時，GWRP就是GMP
- 當dc=1時，GWRP就是GAP
我們首先需要將圖像X對於類別c的所有預測得分進行降序排列，即在索引集合 $I_{c}={i_{1},...,i_{n}}$ 中，使得 $f_{i_{1},c}(x)\geq f_{i_{2},c}(x)\geq ...\geq f_{i_{n},c}(x)$ ，如此，GWRP定義式中 $\sum _{j=1}^{n}(d_{c})^{j-1}f_{i_{j},c}(X)$ 就表示概率越大的所賦予的權重越大
對於GWRP中的衰減參數dc，對每張圖片和每個類別可以單獨設置，但需要很多先驗知識，因此這裏簡單地將dc分爲三類：
1. d+：在圖像中出現的目標類別的衰減參數
2. d-：在圖像中未出現的目標類別的衰減參數
3. dbg：背景類的衰減參數
Expansion Loss 定義如下：

其中，T表示在圖像X中出現的類別的集合，C’\T表示在圖像X中未出現的類別的集合,由此，Expansion loss可以將由Seeding loss生成的初始mask進行合理的擴充

3、Constrain-to-boundary loss

由於由Expansion loss擴充後的mask較大，因此需要對其進行合理的約束，使其更貼近目標邊界，而Constrain-to-boundary loss就是爲此而設計。
首先，我們構造一個fully-connected CRF（全連接條件隨機場），提取得到圖像中的目標邊界；
然後，將神經網絡的輸出和CRF的輸出計算平均KL散度，以此作爲損失函數，使得網絡輸出的mask逐漸擬合CRF輸出的目標邊界
Constrain-to-boundary loss定義如下：

實驗結果

原始圖像：

Seeding Loss

Expansion Loss

Constrain-to-boundary Loss

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

芯片產業管理和營銷指北（4）—— 產品線經理的修行

本篇是系列最後一篇，本系統所有內容均來自俞志宏老師的《我在硅谷管芯片：芯片產品線經理生存指南》一書的總結整理。工程師工作比較線性，需要深挖專業知識，但也僅需要專注於專業知識。通常的工作內容是：：設計某個電路，測試某些參數，解決某

2024-06-10 14:36:43

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

前言注意：學習源碼一定一定不要太關注代碼的編寫，而是注意代碼實現思想：通過設問方式來體現代碼中的思想；方法：5W+1H 源代碼： https://gitee.com/xbhog/mybatis-xbhog ； https://gi

2024-06-10 14:35:12

kube-vip高可用k8s羣

kubeadm init --control-plane-endpoint="192.168.215.200" --kubernetes-version=v1.28.2 --pod-network-cidr=10.244.0.0/16 --

2024-06-10 14:29:12

Mac 安裝 Node Error: Could not symlink include/node/common.gypi

根據提示，賦權限，刪除文件等 jimmy@MacBook-Pro ~ % brew link node Linking /usr/local/Cellar/node/20.0.0... Er

2024-06-10 14:17:51

EDGE瀏覽器新用戶配置登錄Microsoft賬戶出現0x80190001錯誤代碼

在網頁內可以輕鬆反覆登陸Microsoft賬戶，但是在EDGE瀏覽器上無法登陸。瀏覽器原本有一個用戶配置，已經登陸了一個賬號，在創建新的用戶配置時，始終無法登陸賬戶。這個情況持續了兩個星期若是有使用代理，加速器，hosts修改器

2024-06-10 14:13:51

hosts文件丟失或更改後如何還原

無論hosts文件丟失還是被更改了內容，都可以嘗試以下的內容來恢復原樣。一、技術難度：★☆（1星半）閱讀時間：大約2分鐘 hosts文件所在位置：C:\Windows\System32\drivers\etc 二、

2024-06-10 14:13:51

python gdal 安裝使用（Windows， python 3.6.8）

python gdal 安裝使用 python GDAL有兩種安裝方式：第一種是利用 pip install gdal 安裝如果安裝失敗，可以採用下面的方法：第二種離線安裝步驟：（1）查看python版本；（2）下載gdal的

2024-06-10 14:13:11

手繪二維碼

看到二維碼，很容易猜到黑白相間的小方格就是二進制比特。那麼這些比特是怎麼得到的？小方格又是按照什麼規則排布的？今天咱們就從零開始將一個 url 畫成二維碼。考慮到大多數人可能不太瞭解二維碼，所以先講下基礎概念。你也可以先看看左耳朵耗子寫的

2024-06-10 14:11:51

研發高階能力之「技術規劃」

爲什麼規劃是高階能力明確什麼是正確的事（what、why），前置於如何正確的做（how）。真有能力明確，就可以不用親自做提出正確的問題，比解決問題更難權力/權威/影響力，建立在比別人都更正確規劃強依賴的事理

2024-06-10 14:11:51

Vue TypeScript 實戰：掌握靜態類型編程

title: Vue TypeScript 實戰：掌握靜態類型編程 date: 2024/6/10 updated: 2024/6/10 excerpt: 這篇文章介紹瞭如何在TypeScript環境下爲Vue.js應用搭建項目結構，包括

2024-06-10 14:05:40

Python: two dimensional array

# 假設puzzle是一個包含多個字符串的列表，每個字符串都是同一長度的，代表字母網格的一行 puzzle = [ "JGJGDDAOYD", "IDGFHSPOSA", "FGDIOSAFSC

®Geovin Du Dream Park™

2024-06-10 14:03:20

從零手寫實現 nginx-13-nginx.conf 配置例子解釋 + nginx 配置文件要如何解析？

前言大家好，我是老馬。很高興遇到你。我們爲 java 開發者實現了 java 版本的 nginx https://github.com/houbb/nginx4j 如果你想知道 servlet 如何處理的，可以參考我的另一個項目：

2024-06-10 14:02:20

【MySQL】查詢以A字符開頭以B字符結尾的數據

查詢以36823206字符開頭以951字符結尾的SPU數據 select * from lingyejun_product where spu_code regexp '^36823206' and spu_code regexp '95

2024-06-10 13:52:19

Web Page Marker Pen All In One

Web Page Marker Pen All In One Web 網頁標記筆 Free Screenshot Capture & Annotation Tool Useful extension for taking screen

2024-06-10 13:51:29

2024 上海市居民小區的電動自行車使用共享充電服務的充電收費標準和依據 All In One

2024 上海市居民小區的電動自行車使用共享充電服務的充電收費標準和依據 All In One 電動自行車充電服務收費標準合法性、合理性按照實際的充電度數和電費價格收取電費，服務費應該單獨收取每次充電收取的服務費的佔比不能高

2024-06-10 13:51:29

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章