關於Conditional Normalization的文章總結

原創

Just Go For It Now

2020-02-25 12:26

ICLR 2017

論文標題	Modulating early visual processing by language
研究問題	VQA
前提假設	More and more evidence accumulates that words set visual priors which alter how visual information is processed from the very beginning it is observed that P1 signals, which are related to low-level visual features, are modulated while hearing specific words
創新點	率先將CBN引入到VQA的問題當中，通過MLP對輸入的question進行embedding，然後再基於得到的embedding來調控ResNet每個BN層的參數，進而使得模型能在訓練前期實現對圖像信息的調控

ECCV 2016

論文標題	Perceptual Losses for Real-Time Style Transfer and Super-Resolution
研究問題	Style transfer
前提假設	high-quality images can be generated by defining and optimizing perceptual loss functions based on high-level features extracted from pre-trained networks.
創新點	將perceptual loss作用在預訓練好的VGG網絡所提取到的高層語義特徵中，確保了模型能在最後生成與content image語義相一致的圖片
解決方案	整個網絡結構主要由兩個部分構成： Image Transformation Networks （採用了類似ResNet的Encoder-Decoder結構） Perceptual Loss Functions Feature Reconstruction Loss（作用在relu3_3,確保網絡生成的圖片能與content image在high-level feature上保持一致，但是在low-level上可以存在差異） Style Reconstruction Loss.(作用在每一層）
不足之處	每次訓練只能完成一種分割的遷移，不能並行完成多種圖片風格的遷移

ICLR 2017

論文標題	A Learned Representation For Artistic Style
研究問題	Style transfer
前提假設	Two images are similar in content if their high-level features as extracted by a trained classifier are close in Euclidian distance. Two images are similar in style if their low-level features as extracted by a trained classifier share the same statistics or, more concretely, if the difference between the features’ Gram matrices has a small Frobenius norm
創新點	將CIN引入到了style transfer中，通過style image對應的IN層參數來替換content image對應的IN參數
不足之處	無法進行任意風格的圖像遷移

ICCV 2017

論文標題	Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization
研究問題	Style transfer
前提假設	the affine parameters in IN can completely change the style of the output image Motivated by these observations, we argue that instance normalization performs a form of style normalization by normalizing feature statistics, namely the mean and variance
創新點	將AdaINy引入到了style transfer任務中。AdaIN層不存在需要學習的參數，每個affine parameters都從輸入的style image中計算得到，從而實現了任意風格的圖片轉換
解決方案	通過實驗驗證了IN能夠起到風格歸一化的作用每個affine parameters都從輸入的style image中計算得到

AAAI 2020

論文標題	Dynamic Instance Normalization for Arbitrary Style Transfer
研究問題	Style Transfer
前提假設	文章主要基於AdaIN的兩個缺點提出 content rncoder與style encoder的結構許保持一致 encoder的結構得足夠複雜，以確保其能夠提取出更具代表性的圖像特徵
創新點	設計了一個動態的卷積算子來自適應地學習IN層的參數
解決方案	content image對應的encoder由Depthwise Separable Convolutional layer構成，屬於一個輕量級的特徵提取網絡 DIN的輸入爲一張style image,其輸出爲convolution operator的weight與bias,然後基於學得的weight與bias對IN層輸出的feature map進行調整

NurIPS 2019

論文標題	Positional Normalization
研究問題	Style Transfer
前提假設	基於feature map的每個位置來進行通道歸一化。採用這種方式所得到的一階統計量和二階統計量在一定程度上能夠捕獲圖片的空間結構信息
創新點	PONO: processes each position independently, and compute both statistics across the channels Moment Shortcut: 將encoder中每個PONO輸出的參數通過shortcut的方式傳到decoder中，以使得decoder上採樣得到的deature map能更好地保留原始圖片的空間結構信息 Dynamic Moment Shortcut: 和MS不同的一點在於，decoder反捲積層的PONO參數是通過一個額外的網絡（值得注意的是，該網絡以相應的encoder層輸出的mean和standard deviation作爲輸入）學習得到的

CVPR 2019

論文標題	Semantic Image Synthesis with Spatially-Adaptive Normalization
研究問題	Semantic Image Synthesis
前提假設	在語義圖像合成的任務中，採用instance normalization會丟失掉segmentaion mask的語義信息，而空間自適應歸一化的方法則能夠很好地保留segmentation mask的語義信息
創新點	提出了空間自適應歸一化方法，能夠在Image Synthesis task中很好地保留輸入圖像的語義信息

ICLR 2018

論文標題	cGANs with Projection Discriminator
研究問題	GAN
前提假設
創新點
解決方案
不足之處

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

5月21日，文心中國行將走進上海，在張江科學會堂舉行。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，主要圍繞大模型技術如何賦能產業級應用創新展開探討，還有百度風投從投資視角帶來的觀點，讓參會者全方位瞭解

2024-05-17 00:28:21

網絡爬蟲安全：90後小夥，用軟件非法搬運他人原創視頻被判刑

央視《今日說法》欄目近日報道了一名程序員開發非法視頻搬運軟件獲利超700多萬，最終獲刑的案例。國內某知名短視頻平臺報警稱，有人在網絡上售賣一款視頻搬運軟件，使用軟件的人可以繞過平臺的審覈機制，一鍵“搬運”竊取他人作品非法轉載投稿。警方調查

2024-05-16 00:19:26

探索大語言模型：理解Self Attention| 京東物流技術團隊

一、背景知識在ChatGPT引發全球關注之後，學習和運用大型語言模型迅速成爲了熱門趨勢。作爲程序員，我們不僅要理解其表象，更要探究其背後的原理。究竟是什麼使得ChatGPT能夠實現如此卓越的問答性能？自注意力機制的巧妙融入無疑是關鍵因素

2024-05-14 23:57:26

GPU 硬件指標說明

流處理器：也叫渲染管、着色器。畫面都是由一個又一個像素點組成的，而流處理器就負責這些像素點的渲染工作； RT核心：光追核心，用作於光線追蹤效果； CUDA 核心和Tensor 核心：CUDA Core和Tensor Core，爲G

2024-05-13 22:35:43

舌尖上的AI：人工智能技術正在被“端上”餐桌

來源 | 人民數字FINTECH 責編 | 晉兆雨頭圖 | CSDN 下載自視覺中國 #人工智能技術正在被“端上”餐桌四方食事，不過一碗人間煙火。人工智能作爲一門新的技術科學，正在被人間煙火氣“端”上餐桌。人工智能“洗手”

2024-05-13 21:17:25

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

AIGC在京東廣告創意的技術應用

一、前言電商廣告圖片不僅能夠抓住消費者的眼球，還可以傳遞品牌核心價值和故事，建立起與消費者之間的情感聯繫。然而現有的廣告圖片大多依賴人工製作，存在效率和成本的限制。儘管最近AIGC技術取得了卓越的進展，但其在廣告圖片的應

京東雲開發者

2024-05-08 23:24:18

AI繪圖新選擇：Fooocus工具發佈，小顯存助力大模型運行

隨着人工智能技術的飛速發展，AI繪圖工具已經成爲了衆多創作者們的得力助手。它們能夠基於深度學習算法，快速生成高質量的圖像，爲設計、藝術等領域注入了新的活力。然而，傳統的AI繪圖工具往往對硬件要求較高，使得許多擁有較低配置設備的用戶望而卻步。

2024-05-07 23:30:10

GLM國產大模型訓練加速：高效性能與成本優化的實踐

隨着人工智能技術的不斷進步，大模型的訓練成爲了推動深度學習領域發展的重要力量。然而，傳統的訓練方式往往面臨着性能瓶頸和高昂的成本問題，這使得許多研究者和開發者望而卻步。爲了解決這一難題，我們探索了使用OneFlow框架對GLM國產大模型進行

2024-05-07 23:30:09

LoRA微調語言大模型的實用技巧

一、引言隨着深度學習技術的快速發展，語言大模型在自然語言處理領域取得了顯著的進展。然而，傳統的微調方法通常需要大量的計算資源和時間，對於實際應用來說並不友好。爲了解決這個問題，LoRA微調技術應運而生。LoRA（Low-Rank Adap

2024-04-28 11:30:13

京東廣告研發——效率爲王：廣告統一檢索平臺實踐

1、系統概述實踐證明，將互聯網流量變現的在線廣告是互聯網最成功的商業模式，而電商場景是在線廣告的核心場景。京東服務中國數億的用戶和大量的商家，商品池海量。平臺在兼顧用戶體驗、平臺、廣告主收益的前提推送商品具有挑戰性。京東廣告檢索平臺

2024-04-25 23:17:47

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

大模型區域落地再加速！百度“文心中國行”西部首站落地成都錦江

4 月 24 日，“文心中國行”西部地區首站落地成都錦江。成都市錦江區白鷺灣新經濟總部功能區、錦江區投資促進局與百度飛槳攜手合作，打造成都人工智能的新產業、新模式、新業態。來自成都政產學研各界的領導、專家、企業嘉賓，共同探討如何降低 AI

2024-04-25 11:41:53

文心中國行走進成都！4 月 24 日一起把握大模型時代的產業新機遇

4 月 24 日，文心中國行將走進成都。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，從人工智能政策解讀、大模型技術，到產業創新應用的實踐案例，讓參會者全方位瞭解大模型時期的發展與創新機遇。大會還特別

2024-04-23 11:41:07

文心大模型“你說我畫”：PaddleHub與PaddleSpeech的協同實踐

在人工智能領域中，自然語言處理和計算機視覺是兩個非常活躍的研究方向。隨着深度學習技術的發展，這兩個領域之間的交叉融合產生了許多令人興奮的應用場景。其中，“你說我畫”就是這樣一個結合自然語言處理和計算機視覺技術的創新應用。 “你說我畫”的核心

2024-04-22 11:29:20

24小時熱門文章

Nginx R31 doc 官方文檔-01-nginx 如何安裝

最新文章

最新評論文章