風格轉換模型學習記錄

原創

2020-06-21 20:54

論文名稱：A Neural Algorithm of Artistic Style

主要結果：將一副圖片中的風格與另一幅圖片中的內容相轉換。如下圖：

原理：深度學習時一個連續函數模型f(x)=y。其中y是特徵，而x是原圖，現在假設知道了特徵和f，那麼如何求原圖？

可以將x作爲變量，其他參數都固定。具體爲：設x1是空白圖片，f(x1)=y1，最小化|y-y1|這個代價函數，如此做即可得到原圖x。

當然光得到原圖還是不夠的，還要加上風格，風格如何獲取？首先找一個風格圖片，然後將圖片輸給一個訓練好的深度模型，如論文中採用了VGG模型，VGG與resnet類似，都是分成了5個block，論文中採用5個block的輸出作爲求風格的位置。具體求風格的方法是首先每一層（layer）的輸出都是類似於【batch_size,h,w,filters_num】，論文從採用gram矩陣來作爲風格的一個量化，gram矩陣是利用特徵之間的協方差來得到的。而爲什麼論文中是兩個矩陣直接相乘呢？因爲加入均值爲0，那麼兩個向量直接相乘就是兩個向量的協方差，如下公式：

比如在'block1_conv1'這個位置，空白圖片的gram矩陣是A，風格圖片是B，那麼sum(|A-B|)即是loss。於content中說的一樣的方法可以得到風格圖片。

最後講loss乘以係數相加：

ratio α/β was either 1×10 −3 (Fig 2 B,C,D)or 1 × 10 −4。

可調參數：

loss函數中的比例可以調，調了就是風格和內容比例的多少。

風格採用哪些層也可以調，文中採用了好幾種組合方式，具體見論文。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

皮質顏色檢測的幾個問題（VS2010/OpenCV）

1，汽車皮質包覆檢測的基本思路是，先對不同位置、不同顏色、皮質的包覆進行模板採樣，然後針對性做檢測； 2，檢測分三步：（1）首先看灰度均值的差異值，這個可以設個固定閾值；（2

一天到晚游泳的鱼啊鱼

2020-06-29 00:52:02

濾波反投影圖像重建算法

關於CT重建的算法有很多，在這裏給大家介紹的是濾波反投影算法，其原理如下：設f(x,y)表示需要重建的圖像，用p(t,θ)表示在角度獲取的f(x,y)的一個平行投影，t表示投影射線到對稱中心（即旋轉中心）的距離，設s爲於角度θ下的投影X

2020-06-23 01:13:25

相機內參與外參學習記錄與理解

1整體介紹首先，不考慮這些術語，考慮一下成像的流程。我們是在三維空間中生活，假想xw,yw,zw位置附近有一個籃球，而在另外一個其他位置有一個針孔相機，用這個針孔相機對籃球拍照，而拍照時照片中的籃球的像只和籃球面對照相機的那一面有關係，

2020-06-21 20:55:07

人臉匹配學習記錄

論文FaceNet: A Unified Embedding for Face Recognition and Clustering 代碼：https://github.com/davidsandberg/facenet 需要注意的地方：

2020-06-21 20:55:07

圖像處理算法整理

1，清晰度相關算法鈍化或去燥：中值濾波、高斯濾波、傅立葉變換方法、小波變換方法銳化：邊緣提取算法、直方圖或區塊直方圖算法、傅立葉變換方法、小波變換方法傅立葉變換與小波變換的原理是：兩者都是用希爾伯特函數空間的一組正交函數基來將圖像函

2020-06-21 20:55:07

MAP學習記錄

主要參考https://github.com/rafaelpadilla/Object-Detection-Metrics 名詞解釋預測結果分爲4個類： TP：你的預測正確的預測了目標 FP：你的預測錯誤的預測了目標 FN：有一個目標你

2020-06-21 20:54:56

相機標定學習記錄

https://www.cnblogs.com/wangguchangqing/p/8335131.html 大體計算流程第一步算每張圖片的單應矩陣H，但應矩陣有8個未知參數，共需8個像素座標和世界座標來算，8個對應點：第二步：

2020-06-21 20:54:56

光流法學習記錄

https://blog.csdn.net/qq_41368247/article/details/82562165參考這個寫的也很細補充的地方就是泰勒級數展開那一步糾結了1個小時，特意去看了一下多元泰勒級數展開： https://zh

2020-06-21 20:54:56

網卡參數設置建議與各個網卡參數含義詳解

自從和無盤開始打交道，學到了n多知識，無論是軟件層面還是硬件層面，無論是理論還是實踐層面，之前很多人認爲無盤很複雜，而我也受其“誤導”認爲無盤很複雜，但實際上用下來發現，其實無盤確實很簡單，而所謂的無盤複雜，更多的是理論和經驗的結合，以前

2020-06-13 11:12:50

GIGE傳輸層的參數

2020-06-13 11:12:50

卷積的計算

2020-05-31 16:54:00

卷積核翻轉方法

2020-05-31 16:54:00

PCL1.8.0+VS2013+Win10 x64 和 win10+pcl1.8.1+vs2015超詳細配置方案加安裝遇到的問題

2020-03-31 03:15:08

圖像處理技術之六：深度圖像+彩色圖像=點雲圖像

2020-03-05 01:09:21

圖像處理技術之八：點雲圖、深度圖像

2020-03-05 01:09:21

24小時熱門文章

最新文章

最新評論文章