Disentangled Image Matting閱讀筆記（二）

原創

来路与归途

2020-03-24 22:29

會議：ICCV-2019

概述：

大部分先前的圖像摳圖方法都需要輸入一個粗略的trimap，來估計未知區域的alphad1值，論文認爲trimap是粗略的，而之前的模型將trimap作爲輸入，試圖估計一個好的蒙版，存在一個迴歸問題；

AdaMatting一個新的端到端的圖像修復框架，將任務分解爲兩個子任務 trimap adaptation 和 alpha estimation

trimap adaptation：

一個像素分類問題，通過識別圖像的前景區域、背景區域、半透明區域來推斷圖像的結構

alpha estimation：

一個迴歸問題，計算每一個混合像素的值

1.介紹

輸入圖像可以被建模爲前景與背景顏色的線性組合：

論文認爲以前的論文以trimap作爲輸入，存在不夠精確的問題，且一個分類問題不足以解決圖像摳圖問題；

未知區域的像素可以分爲三種：不透明的前景、不透明的背景、和半透明的混合像素，而圖像摳圖的目的是不透明像素生成精確的0,1，而半透明像素精確估計混合像素值，故而將該任務分解爲trimap adaptation-未知像素的分類問題和alpha estimation-混合像素值的估計問題；

現在的方法過度依賴低維特徵，比如顏色分佈、上下文，缺乏對高維信息——語義的使用

2.相關工作

自然圖像摳圖

Trimap生成

多任務學習

3方法

trimap adaptation：

蒙版值代表的含義：

根據的定義，圖像摳圖自然可以分爲兩步：1.決定蒙版像素值是1,0或其他；2.精確計算半透明區域的值

網絡概述

有一個編碼網絡，兩個解碼網絡（分別對應trimap adaptation 和 alpha estimation），一個propagation單元組成

網絡以圖像與對應的trimap 聯合作爲輸入，首先經過編碼網絡（ResNet-50）生成特徵圖，然後經過兩個解碼網絡（由3*3的卷積層和上採樣模塊組成），trimap解碼（T-Decoder）輸出3通道的分類圖，alpha解碼（A-Decoder）輸出1通道的蒙版值

多任務自動編碼

基於U-Net並加入global convolutions來擴大感受野

propagation單元

由兩個ResBlocks和一個LSTM cell組成

損失函數

T和 α分別爲T-Decoder和A-Decoder的輸出，σ1 和 σ2爲兩個任務的權重參數，LT （交叉熵損失）and Lα（L1正則化損失）分別爲trimap解碼、alpha解碼的損失

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Disentangled Image Matting閱讀筆記（二）

概述：

trimap adaptation：

alpha estimation：

1.介紹

2.相關工作

3方法

trimap adaptation：

網絡概述

多任務自動編碼

propagation單元

損失函數

如何使用 JS 判斷用戶是否處於活躍狀態

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

支持度、置信度和提升度

python文檔壓縮與解壓——zipfile

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 閱讀筆記

n-gram語言模型

U-Net: Convolutional Networks for Biomedical Image Segmentation閱讀筆記

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結