ICLR 2017
論文標題 |
Modulating early visual processing by language |
研究問題 |
VQA |
前提假設 |
|
創新點 |
率先將CBN引入到VQA的問題當中,通過MLP對輸入的question進行embedding,然後再基於得到的embedding來調控ResNet每個BN層的參數,進而使得模型能在訓練前期實現對圖像信息的調控 |
ECCV 2016
論文標題 |
Perceptual Losses for Real-Time Style Transfer and Super-Resolution |
研究問題 |
Style transfer |
前提假設 | high-quality images can be generated by defining and optimizing perceptual loss functions based on high-level features extracted from pre-trained networks. |
創新點 | 將perceptual loss作用在預訓練好的VGG網絡所提取到的高層語義特徵中,確保了模型能在最後生成與content image語義相一致的圖片 |
解決方案 |
整個網絡結構主要由兩個部分構成:
|
不足之處 | 每次訓練只能完成一種分割的遷移,不能並行完成多種圖片風格的遷移 |
ICLR 2017
論文標題 |
A Learned Representation For Artistic Style |
研究問題 | Style transfer |
前提假設 |
|
創新點 | 將CIN引入到了style transfer中,通過style image對應的IN層參數來替換content image對應的IN參數 |
不足之處 | 無法進行任意風格的圖像遷移 |
ICCV 2017
論文標題 |
Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization |
研究問題 | Style transfer |
前提假設 |
|
創新點 | 將AdaINy引入到了style transfer任務中。AdaIN層不存在需要學習的參數,每個affine parameters都從輸入的style image中計算得到,從而實現了任意風格的圖片轉換 |
解決方案 |
|
AAAI 2020
論文標題 |
Dynamic Instance Normalization for Arbitrary Style Transfer |
研究問題 |
Style Transfer |
前提假設 |
文章主要基於AdaIN的兩個缺點提出
|
創新點 | 設計了一個動態的卷積算子來自適應地學習IN層的參數 |
解決方案 |
|
NurIPS 2019
論文標題 |
Positional Normalization |
研究問題 |
Style Transfer |
前提假設 | 基於feature map的每個位置來進行通道歸一化。採用這種方式所得到的一階統計量和二階統計量在一定程度上能夠捕獲圖片的空間結構信息 |
創新點 |
|
CVPR 2019
論文標題 |
Semantic Image Synthesis with Spatially-Adaptive Normalization |
研究問題 |
Semantic Image Synthesis |
前提假設 | 在語義圖像合成的任務中,採用instance normalization會丟失掉segmentaion mask的語義信息,而空間自適應歸一化的方法則能夠很好地保留segmentation mask的語義信息 |
創新點 | 提出了空間自適應歸一化方法,能夠在Image Synthesis task中很好地保留輸入圖像的語義信息 |
ICLR 2018
論文標題 |
cGANs with Projection Discriminator |
研究問題 |
GAN |
前提假設 | |
創新點 | |
解決方案 | |
不足之處 |