Disentangled Image Matting閱讀筆記(二)

會議:ICCV-2019

概述:

大部分先前的圖像摳圖方法都需要輸入一個粗略的trimap,來估計未知區域的alphad1值,論文認爲trimap是粗略的,而之前的模型將trimap作爲輸入,試圖估計一個好的蒙版,存在一個迴歸問題;

AdaMatting一個新的端到端的圖像修復框架,將任務分解爲兩個子任務 trimap adaptation 和 alpha estimation

trimap adaptation:

一個像素分類問題,通過識別圖像的前景區域、背景區域、半透明區域來推斷圖像的結構

alpha estimation:

一個迴歸問題,計算每一個混合像素的值

1.介紹

輸入圖像可以被建模爲前景與背景顏色的線性組合:

 論文認爲以前的論文以trimap作爲輸入,存在不夠精確的問題,且一個分類問題不足以解決圖像摳圖問題;

未知區域的像素可以分爲三種:不透明的前景、不透明的背景、和半透明的混合像素,而圖像摳圖的目的是不透明像素生成精確的0,1,而半透明像素精確估計混合像素值,故而將該任務分解爲trimap adaptation-未知像素的分類問題和alpha estimation-混合像素值的估計問題;

現在的方法過度依賴低維特徵,比如顏色分佈、上下文,缺乏對高維信息——語義的使用

2.相關工作

自然圖像摳圖

Trimap生成

多任務學習

3方法

 

trimap adaptation:

蒙版值代表的含義:

根據 的定義,圖像摳圖自然可以分爲兩步:1.決定蒙版像素值是1,0或其他;2.精確計算半透明區域的值

網絡概述

有一個編碼網絡,兩個解碼網絡(分別對應trimap adaptation 和 alpha estimation),一個propagation單元組成

網絡以圖像與對應的trimap 聯合作爲輸入,首先經過編碼網絡(ResNet-50)生成特徵圖,然後經過兩個解碼網絡(由3*3的卷積層和上採樣模塊組成),trimap解碼(T-Decoder)輸出3通道的分類圖,alpha解碼(A-Decoder)輸出1通道的蒙版值

多任務自動編碼

基於U-Net並加入global convolutions來擴大感受野

propagation單元

由兩個ResBlocks和一個LSTM cell組成

損失函數

T和 α分別爲T-Decoder和A-Decoder的輸出,σ1 和 σ2爲兩個任務的權重參數,LT (交叉熵損失)and Lα(L1正則化損失)分別爲trimap解碼、alpha解碼的損失

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章