深度學習：GAN（1）

原創

2020-07-01 23:56

GAN該部分知識點主要參考網上的視頻資料，並用文字整理下來，方便以後查看。

在學習GAN之前需要知道這麼一句話：“what I cannot create, I do not understand”
意思是我們需要實戰寫一個GAN模型，才能理解GAN。

1 數據分佈 $p(x)$

在說GAN之前需要了解什麼是數據分佈。

我們的目的是需要掌握數據的分佈 $p(x)$ ，才能創造該類型的數據。

那麼對於一個數據集 $p(x)$ 是什麼樣子的呢？我們之前學過的高斯、泊松、伯努利這些簡單的分佈不再適合大數據集。

可以斷定 $p(x)$ 不是我們已知的分佈函數，長什麼樣子、參數我們也不知道，但是爲了便於公式推導和模型算法描述，通常我們用 $p(x)$ 來表示一個數據集的分佈，僅僅是一個表示和輔助性的推理。(沒人知道分佈是什麼)

即使是MINST數據集，我們也不知道 $p(x)$ 分佈表達式是什麼。通過降維到3維度，可以勉強畫出來該數據集的分佈 $p(x)$ ，如下：

2 如何學習 $p(x)$

通過神經網絡去逼近分佈 $p(x)$ ，一般是用生成器來生成，並用判別器來對抗訓練。一個簡單的GAN流程圖爲下，最後達到納什均衡點。

最後使得生成器生成的 $p_g(x)\sim p_r(x)$

3 GAN損失函數

怎麼訓練呢？損失函數爲：

首先明白 $\min \limits_G$ 表示對於G而言我們需要該公式取最小值。同理， $\max \limits_D$ 表示對於D而言，我們需要取得該公式最大值。E表示期望。

在上式中， $p_r(x)$ 表示實際樣本數據， $p_z(x)$ 表示生成器生成的數據，z表示給的提示信息，如果沒有就是隨機噪聲。詳解可以看：GAN: 原始損失函數詳解。值得提出的是，對於生成器G ，需要騙過判別器D，使得 $D(G(z))$ 變大，那麼整個公式就會變小，因而是 $\min \limits_G$ 。

4 如何實現？

x—>D—>D(x)，其中D(x)是表示概率值，是一個標量
z—>G—> $x'_g$ —>D—>D(G(Z))，其中D(G(Z))也是一個標量。

這裏推薦一個在線訓練GAN模型的網站：GAN Playground 。進去可以看到，（生成器最開始是一個100隨機維向量）。

5 如何收斂

5.1 先固定G,D如何收斂

根據上面GAN公式可以得到，其中E表示期望， $E[f(x)]=\int_{}p(x)f(x)dx$ ，則可以推導爲：

在這裏，可以令 $p_{data}(x)$ 是一個固定的值A， $p_{g}(x)$ 也是個固定的值B，此時他們是與判別器D無關的，可以這麼做。

那麼當 $V(G,D)$ 求極大值的時候，其導數爲0。則有：

此時可以得出

5.2 固定D,G如何收斂

介紹這部分，首先需要知道KL,JS散度的定義：

現在我們來計算下 $D_{JS}(p||q)$ ,如下：

因此可以得到：

此時需要最小化該公式。該公式表示，當D固定好了，此時當 $p_r=p_g$ 取最小值，即生成器生成的數據和真實數據一致。（ $D_{JS}(p||q)\geq 0$ ）

那麼當 $p_r=p_g$ 時， $D^*(x)=\frac{1}{2}$ ，便是納什均衡。

6 A~Z GAN，越來越多的論文

GAN論文越來越多，一般都喜歡在GAN前面加上字母命名，變成自己的方法（A~Z GAN）。github上面由GAN論文集合：A~Z GAN

讀其中一些經典的論文就可以。

6.1 DCGAN

6.2 如何穩定優化（WGAN）

$p_g$ 和 $p_{data}$ 幾乎不會有重疊，因此不訓練的話，生成器永遠也不會生成一張和原始很像的數據。若P和Q完全沒有重疊的分佈，那麼此時KL爲 $+\infty$ ， $JS=log2$ 。優化會很困難，梯度會彌散無法更新。因此GAN在訓練前期會不穩定。

WGAN可以很好解決這個問題，即不在相關的區域也可以慢慢優化。

可以看出，在DCGAN中，JS的損失一直都沒有優化。因此引入了Wasserstein距離。

上式中 $f$ 是一個神經網絡，需要學習，是沃森距離。之前是D~JS，現在是 $f_D$ ~WD，主要解決前期不好訓練的問題。

6.3 擴展版本 WGAN-Gradient Penalty

公式右邊項是正則化。可以解決GAN訓練不穩定的問題，同時效果也不錯。

GAN不穩定的根本原因就是，初始的 $p_z$ 和原始的分佈 $p_r$ 分佈不重合的時候，訓練梯度彌散。

下一部分就是，用Pytorch來實戰。深度學習：GAN(2)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

GLM國產大模型訓練加速：高效性能與成本優化的實踐

隨着人工智能技術的不斷進步，大模型的訓練成爲了推動深度學習領域發展的重要力量。然而，傳統的訓練方式往往面臨着性能瓶頸和高昂的成本問題，這使得許多研究者和開發者望而卻步。爲了解決這一難題，我們探索了使用OneFlow框架對GLM國產大模型進行

2024-05-07 23:30:09

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

爲程序員和新手準備的 8 大 Python 工具

Python 是一種開源編程語言，用於 Web 編程、數據科學、人工智能和許多科學應用。學習 Python 使程序員能夠專注於解決問題，而不是專注於語法，其豐富的庫賦予它完成偉大任務所需的力量。 1) IDLE 安裝 Python 時

2024-05-14 01:06:43

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國l

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過 80% 的

2024-05-13 21:25:35

理論+實踐，帶你瞭解分佈式訓練

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

2024年DataOps趨勢預測：AI不會取代數據工程師

APM digest收集了多位行業專家對DataOps在2024的發展形勢及對IT和業務的影響的預測，這些技術最高管理者，包括Confluent技術戰略負責人Andrew Sellers的深刻洞見可能與你的感覺一致嗎？快來探討一下。數據可

2024-04-30 11:49:29

數字化轉型新篇章：企業通往智能化的新範式

早在十多年前，一些具有前瞻視野的企業以實現“數字化”爲目標啓動轉型實踐。但時至今日，可以說尚無幾家企業能夠在真正意義上實現“數字化”。在實現“數字化”的征途上，人們發現，努力愈進，彷彿終點愈遠。究其原因，還在於轉型一直落後於技術邊界的拓展

2024-04-29 21:22:20

探索大語言模型：理解Self Attention| 京東物流技術團隊

一、背景知識在ChatGPT引發全球關注之後，學習和運用大型語言模型迅速成爲了熱門趨勢。作爲程序員，我們不僅要理解其表象，更要探究其背後的原理。究竟是什麼使得ChatGPT能夠實現如此卓越的問答性能？自注意力機制的巧妙融入無疑是關鍵因素

2024-05-14 23:57:26

GPU 硬件指標說明

流處理器：也叫渲染管、着色器。畫面都是由一個又一個像素點組成的，而流處理器就負責這些像素點的渲染工作； RT核心：光追核心，用作於光線追蹤效果； CUDA 核心和Tensor 核心：CUDA Core和Tensor Core，爲G

2024-05-13 22:35:43

舌尖上的AI：人工智能技術正在被“端上”餐桌

來源 | 人民數字FINTECH 責編 | 晉兆雨頭圖 | CSDN 下載自視覺中國 #人工智能技術正在被“端上”餐桌四方食事，不過一碗人間煙火。人工智能作爲一門新的技術科學，正在被人間煙火氣“端”上餐桌。人工智能“洗手”

2024-05-13 21:17:25

AIGC在京東廣告創意的技術應用

一、前言電商廣告圖片不僅能夠抓住消費者的眼球，還可以傳遞品牌核心價值和故事，建立起與消費者之間的情感聯繫。然而現有的廣告圖片大多依賴人工製作，存在效率和成本的限制。儘管最近AIGC技術取得了卓越的進展，但其在廣告圖片的應

京東雲開發者

2024-05-08 23:24:18

AI繪圖新選擇：Fooocus工具發佈，小顯存助力大模型運行

隨着人工智能技術的飛速發展，AI繪圖工具已經成爲了衆多創作者們的得力助手。它們能夠基於深度學習算法，快速生成高質量的圖像，爲設計、藝術等領域注入了新的活力。然而，傳統的AI繪圖工具往往對硬件要求較高，使得許多擁有較低配置設備的用戶望而卻步。

2024-05-07 23:30:10

LoRA微調語言大模型的實用技巧

一、引言隨着深度學習技術的快速發展，語言大模型在自然語言處理領域取得了顯著的進展。然而，傳統的微調方法通常需要大量的計算資源和時間，對於實際應用來說並不友好。爲了解決這個問題，LoRA微調技術應運而生。LoRA（Low-Rank Adap

2024-04-28 11:30:13

京東廣告研發——效率爲王：廣告統一檢索平臺實踐

1、系統概述實踐證明，將互聯網流量變現的在線廣告是互聯網最成功的商業模式，而電商場景是在線廣告的核心場景。京東服務中國數億的用戶和大量的商家，商品池海量。平臺在兼顧用戶體驗、平臺、廣告主收益的前提推送商品具有挑戰性。京東廣告檢索平臺

2024-04-25 23:17:47

24小時熱門文章

最新文章

最新評論文章