关于Conditional Normalization的文章总结

原創

Just Go For It Now

2020-02-25 12:26

ICLR 2017

论文标题	Modulating early visual processing by language
研究问题	VQA
前提假设	More and more evidence accumulates that words set visual priors which alter how visual information is processed from the very beginning it is observed that P1 signals, which are related to low-level visual features, are modulated while hearing specific words
创新点	率先将CBN引入到VQA的问题当中，通过MLP对输入的question进行embedding，然后再基于得到的embedding来调控ResNet每个BN层的参数，进而使得模型能在训练前期实现对图像信息的调控

ECCV 2016

论文标题	Perceptual Losses for Real-Time Style Transfer and Super-Resolution
研究问题	Style transfer
前提假设	high-quality images can be generated by defining and optimizing perceptual loss functions based on high-level features extracted from pre-trained networks.
创新点	将perceptual loss作用在预训练好的VGG网络所提取到的高层语义特征中，确保了模型能在最后生成与content image语义相一致的图片
解决方案	整个网络结构主要由两个部分构成： Image Transformation Networks （采用了类似ResNet的Encoder-Decoder结构） Perceptual Loss Functions Feature Reconstruction Loss（作用在relu3_3,确保网络生成的图片能与content image在high-level feature上保持一致，但是在low-level上可以存在差异） Style Reconstruction Loss.(作用在每一层）
不足之处	每次训练只能完成一种分割的迁移，不能并行完成多种图片风格的迁移

ICLR 2017

论文标题	A Learned Representation For Artistic Style
研究问题	Style transfer
前提假设	Two images are similar in content if their high-level features as extracted by a trained classifier are close in Euclidian distance. Two images are similar in style if their low-level features as extracted by a trained classifier share the same statistics or, more concretely, if the difference between the features’ Gram matrices has a small Frobenius norm
创新点	将CIN引入到了style transfer中，通过style image对应的IN层参数来替换content image对应的IN参数
不足之处	无法进行任意风格的图像迁移

ICCV 2017

论文标题	Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization
研究问题	Style transfer
前提假设	the affine parameters in IN can completely change the style of the output image Motivated by these observations, we argue that instance normalization performs a form of style normalization by normalizing feature statistics, namely the mean and variance
创新点	将AdaINy引入到了style transfer任务中。AdaIN层不存在需要学习的参数，每个affine parameters都从输入的style image中计算得到，从而实现了任意风格的图片转换
解决方案	通过实验验证了IN能够起到风格归一化的作用每个affine parameters都从输入的style image中计算得到

AAAI 2020

论文标题	Dynamic Instance Normalization for Arbitrary Style Transfer
研究问题	Style Transfer
前提假设	文章主要基于AdaIN的两个缺点提出 content rncoder与style encoder的结构许保持一致 encoder的结构得足够复杂，以确保其能够提取出更具代表性的图像特征
创新点	设计了一个动态的卷积算子来自适应地学习IN层的参数
解决方案	content image对应的encoder由Depthwise Separable Convolutional layer构成，属于一个轻量级的特征提取网络 DIN的输入为一张style image,其输出为convolution operator的weight与bias,然后基于学得的weight与bias对IN层输出的feature map进行调整

NurIPS 2019

论文标题	Positional Normalization
研究问题	Style Transfer
前提假设	基于feature map的每个位置来进行通道归一化。采用这种方式所得到的一阶统计量和二阶统计量在一定程度上能够捕获图片的空间结构信息
创新点	PONO: processes each position independently, and compute both statistics across the channels Moment Shortcut: 将encoder中每个PONO输出的参数通过shortcut的方式传到decoder中，以使得decoder上采样得到的deature map能更好地保留原始图片的空间结构信息 Dynamic Moment Shortcut: 和MS不同的一点在于，decoder反卷积层的PONO参数是通过一个额外的网络（值得注意的是，该网络以相应的encoder层输出的mean和standard deviation作为输入）学习得到的

CVPR 2019

论文标题	Semantic Image Synthesis with Spatially-Adaptive Normalization
研究问题	Semantic Image Synthesis
前提假设	在语义图像合成的任务中，采用instance normalization会丢失掉segmentaion mask的语义信息，而空间自适应归一化的方法则能够很好地保留segmentation mask的语义信息
创新点	提出了空间自适应归一化方法，能够在Image Synthesis task中很好地保留输入图像的语义信息

ICLR 2018

论文标题	cGANs with Projection Discriminator
研究问题	GAN
前提假设
创新点
解决方案
不足之处

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

618网购节，电商能挡住恶意网络爬虫的攻击吗？

2023年，杭州中院審結了兩起涉及“搬店軟件”的不正當競爭案件。本案的原告是國內某大型知名電子商務平臺的運營主體，而被告則是開發了一款名爲“某搬家快速商品上貨批量發佈”的複製軟件，被控非法獲取平臺商品信息並在其他服務市場銷售。根據原告的訴

2024-06-07 00:14:57

大模型在推荐系统中的精准推荐策略与实践

引言推薦系統在現代互聯網應用中佔據了極其重要的位置。無論是電商平臺、社交媒體、音樂和視頻流媒體服務，還是新聞和內容推薦系統，推薦系統都在提高用戶體驗和平臺收益方面發揮着關鍵作用。近年來，隨着人工智能和機器學習技術的迅猛發展，大模型（如G

2024-06-06 23:55:10

原来Stable Diffusion是这样工作的

stable diffusion是一種潛在擴散模型，可以從文本生成人工智能圖像。爲什麼叫做潛在擴散模型呢？這是因爲與在高維圖像空間中操作不同，它首先將圖像壓縮到潛在空間中，然後再進行操作。在這篇文章中，我們將深入瞭解它到底是如何工作的,還

2024-06-06 21:38:48

什么是LLM大模型训练，详解Transformer结构模型

本文分享自華爲雲社區《LLM 大模型學習必知必會系列(四)：LLM訓練理論篇以及Transformer結構模型詳解》，作者：汀丶。 1.模型/訓練/推理知識介紹深度學習領域所謂的“模型”，是一個複雜的數學公式構成的計算步驟。爲了便於理解

2024-06-04 11:09:34

Prompt Tuning：大模型微调实战

隨着深度學習技術的不斷髮展，大模型在各種任務中取得了顯著的成果。然而，大模型的訓練需要大量的數據和算力，導致在實際應用中受到限制。爲了解決這個問題，研究者們提出了微調的方法，即使用預訓練模型在少量數據上進行訓練，使其適應特定的任務。在Pr

2024-06-03 12:14:42

走进京东“卓越研效架构师”首期研习营圆满收官

五月的北京，春深半夏，花開滿城。由全國雲計算技術行業產教融合共同體牽頭，攜手工業和信息化部電子第五研究所、E³CI軟件研發效能度量工作委員會以及京東雲共同主辦的“走進京東——卓越研效架構師”研習營，於5月17-18日和24-26日在北京京東

2024-05-31 23:55:49

儿童节变身小小音乐家*用ModelArts制作一张AIGC音乐专辑

本文分享自華爲雲社區《兒童節變身小小音樂家*用ModelArts製作一張AIGC音樂專輯》*作者* 華爲雲社區精選。兒童節*如何給小朋友準備一份特別的禮物* 這份AIGC音樂專輯製作攻略一定要收下一段文字靈感就能編織出一曲悠揚悅耳的旋

2024-05-31 11:04:39

金融反欺诈指南：车险欺诈为何如此猖獗？

青島市人民檢察院在其官方微信公衆號上發佈的梁某保險詐騙案顯示，2020 年以來，某汽修廠負責人梁某、某汽車服務公司負責人孫某，與保險公司的趙某等人相互勾結，收購二手北汽等品牌新能源汽車，併爲這些車輛購買車損險。隨後，他們利用暴雨天氣，故意製

2024-05-30 00:16:51

基于Fluid与JindoCache的大模型训练加速实践

隨着人工智能技術的不斷髮展，深度學習模型變得越來越複雜，參數量動輒幾十億甚至上百億。這樣的“大模型”在帶來強大性能的同時，也對訓練過程提出了極高的要求。尤其是在數據加載和計算資源利用方面，傳統的訓練方法往往難以滿足快速、高效的需求。爲此，我

2024-05-28 12:12:15

【终极指南】使用Python可视化分析文本情感倾向

本文分享自華爲雲社區《Python理解文本情感傾向的終極指南》，作者：檸檬味擁抱。情感分析是一種通過自然語言處理技術來識別、提取和量化文本中的情感傾向的方法。Python在這一領域有着豐富的庫和工具，如NLTK、TextBlob和VAD

2024-05-28 10:58:03

AI安全志：英国AI骗保事件增加300%！

最近，英國《衛報》報道稱，一些騙子正在利用人工智能照片編輯軟件篡改照片，以進行保險欺詐活動。這一發現令保險公司震驚，因爲這可能導致汽車保險費用飆升至歷史最高水平。安聯保險公司表示，從2021年至2023年期間，利用應用程序篡

2024-05-28 00:15:50

解读注意力机制原理，教你使用Python实现深度学习模型

本文分享自華爲雲社區《使用Python實現深度學習模型：注意力機制（Attention）》，作者：Echo_Wish。在深度學習的世界裏，注意力機制（Attention Mechanism）是一種強大的技術，被廣泛應用於自然語言處理（NL

2024-05-27 10:58:44

智能测试持续加码，大模型引领软件测试新生态

在軟件行業日新月異的今天，智能測試已成爲提升軟件質量的關鍵環節。大模型的崛起，更是爲軟件測試帶來了前所未有的變革。隨着AI和ML技術的突飛猛進，智能測試得到了快速發展，實現了對測試過程的自動化和智能化管理，顯著提高了測試效率和質量。如今，智

2024-05-25 02:07:17

风控指南：国内车险欺诈呈现四大趋势

2024年4月11日，國家金融監督管理總局官網發佈國家金融監督管理總局關於《反保險欺詐工作辦法（徵求意見稿）》公開徵求意見的公告。《徵求意見》共6章、37條，明確反保險欺詐工作目標是建立“監管引領、機構爲主、行業聯防、各方協同”四位一體的

2024-05-23 12:16:45

智能高效的IDE GoLand v2024.1全新发布 - 进一步升级AI辅助工具

GoLand 使 Go 代碼的閱讀、編寫和更改變得非常容易。即時錯誤檢測和修復建議，通過一步撤消快速安全重構，智能代碼完成，死代碼檢測和文檔提示幫助所有 Go 開發人員，從新手到經驗豐富的專業人士，創建快速、高效、和可靠的代碼。立即獲取G

2024-05-21 12:19:26

24小時熱門文章

最新文章

最新評論文章