深度学习：GAN（1）

原創

2020-07-01 23:56

GAN该部分知识点主要参考网上的视频资料，并用文字整理下来，方便以后查看。

在学习GAN之前需要知道这么一句话：“what I cannot create, I do not understand”
意思是我们需要实战写一个GAN模型，才能理解GAN。

1 数据分布 $p(x)$

在说GAN之前需要了解什么是数据分布。

我们的目的是需要掌握数据的分布 $p(x)$ ，才能创造该类型的数据。

那么对于一个数据集 $p(x)$ 是什么样子的呢？我们之前学过的高斯、泊松、伯努利这些简单的分布不再适合大数据集。

可以断定 $p(x)$ 不是我们已知的分布函数，长什么样子、参数我们也不知道，但是为了便于公式推导和模型算法描述，通常我们用 $p(x)$ 来表示一个数据集的分布，仅仅是一个表示和辅助性的推理。(没人知道分布是什么)

即使是MINST数据集，我们也不知道 $p(x)$ 分布表达式是什么。通过降维到3维度，可以勉强画出来该数据集的分布 $p(x)$ ，如下：

2 如何学习 $p(x)$

通过神经网络去逼近分布 $p(x)$ ，一般是用生成器来生成，并用判别器来对抗训练。一个简单的GAN流程图为下，最后达到纳什均衡点。

最后使得生成器生成的 $p_g(x)\sim p_r(x)$

3 GAN损失函数

怎么训练呢？损失函数为：

首先明白 $\min \limits_G$ 表示对于G而言我们需要该公式取最小值。同理， $\max \limits_D$ 表示对于D而言，我们需要取得该公式最大值。E表示期望。

在上式中， $p_r(x)$ 表示实际样本数据， $p_z(x)$ 表示生成器生成的数据，z表示给的提示信息，如果没有就是随机噪声。详解可以看：GAN: 原始损失函数详解。值得提出的是，对于生成器G ，需要骗过判别器D，使得 $D(G(z))$ 变大，那么整个公式就会变小，因而是 $\min \limits_G$ 。

4 如何实现？

x—>D—>D(x)，其中D(x)是表示概率值，是一个标量
z—>G—> $x'_g$ —>D—>D(G(Z))，其中D(G(Z))也是一个标量。

这里推荐一个在线训练GAN模型的网站：GAN Playground 。进去可以看到，（生成器最开始是一个100随机维向量）。

5 如何收敛

5.1 先固定G,D如何收敛

根据上面GAN公式可以得到，其中E表示期望， $E[f(x)]=\int_{}p(x)f(x)dx$ ，则可以推导为：

在这里，可以令 $p_{data}(x)$ 是一个固定的值A， $p_{g}(x)$ 也是个固定的值B，此时他们是与判别器D无关的，可以这么做。

那么当 $V(G,D)$ 求极大值的时候，其导数为0。则有：

此时可以得出

5.2 固定D,G如何收敛

介绍这部分，首先需要知道KL,JS散度的定义：

现在我们来计算下 $D_{JS}(p||q)$ ,如下：

因此可以得到：

此时需要最小化该公式。该公式表示，当D固定好了，此时当 $p_r=p_g$ 取最小值，即生成器生成的数据和真实数据一致。（ $D_{JS}(p||q)\geq 0$ ）

那么当 $p_r=p_g$ 时， $D^*(x)=\frac{1}{2}$ ，便是纳什均衡。

6 A~Z GAN，越来越多的论文

GAN论文越来越多，一般都喜欢在GAN前面加上字母命名，变成自己的方法（A~Z GAN）。github上面由GAN论文集合：A~Z GAN

读其中一些经典的论文就可以。

6.1 DCGAN

6.2 如何稳定优化（WGAN）

$p_g$ 和 $p_{data}$ 几乎不会有重叠，因此不训练的话，生成器永远也不会生成一张和原始很像的数据。若P和Q完全没有重叠的分布，那么此时KL为 $+\infty$ ， $JS=log2$ 。优化会很困难，梯度会弥散无法更新。因此GAN在训练前期会不稳定。

WGAN可以很好解决这个问题，即不在相关的区域也可以慢慢优化。

可以看出，在DCGAN中，JS的损失一直都没有优化。因此引入了Wasserstein距离。

上式中 $f$ 是一个神经网络，需要学习，是沃森距离。之前是D~JS，现在是 $f_D$ ~WD，主要解决前期不好训练的问题。

6.3 扩展版本 WGAN-Gradient Penalty

公式右边项是正则化。可以解决GAN训练不稳定的问题，同时效果也不错。

GAN不稳定的根本原因就是，初始的 $p_z$ 和原始的分布 $p_r$ 分布不重合的时候，训练梯度弥散。

下一部分就是，用Pytorch来实战。深度学习：GAN(2)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AI安全志：英国AI骗保事件增加300%！

最近，英國《衛報》報道稱，一些騙子正在利用人工智能照片編輯軟件篡改照片，以進行保險欺詐活動。這一發現令保險公司震驚，因爲這可能導致汽車保險費用飆升至歷史最高水平。安聯保險公司表示，從2021年至2023年期間，利用應用程序篡

2024-05-28 00:15:50

风控指南：国内车险欺诈呈现四大趋势

2024年4月11日，國家金融監督管理總局官網發佈國家金融監督管理總局關於《反保險欺詐工作辦法（徵求意見稿）》公開徵求意見的公告。《徵求意見》共6章、37條，明確反保險欺詐工作目標是建立“監管引領、機構爲主、行業聯防、各方協同”四位一體的

2024-05-23 12:16:45

还能报名！风靡硅谷开发者的 Unstructured Data Meetup 即将登陆中国！

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過 80% 的

2024-05-29 02:18:59

文心大模型免费辣，动手搓点啥庆祝一下吧

5月21日下午，百度智能雲宣佈文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費，即刻生效。這兩款大模型都是今年3月剛剛發佈的，均支持8K和128k上下文長度。可以說，這是百度最新的模型

2024-05-24 12:13:22

五款扩展组件齐发 —— Volcano、Keda、Crane-scheduler 等，邀你体验

今年 3 月，KubeSphere 啓動了首屆擴展組件開發者訓練營，吸引了 60 名開發者報名。經過一個半月的密集培訓和實戰演練，這些開發者成功打造了五款創新的擴展組件，現已全部上架至 KubeSphere Marketplace，歡迎大家

2024-05-23 11:17:40

基于 Milvus + LlamaIndex 实现高级 RAG

隨着大語言模型（LLM）技術的發展，RAG（Retrieval Augmented Generation）技術得到了廣泛探討和研究，越來越多的高級 RAG 檢索方法也隨之被人發現，相對於普通的 RAG 檢索，高級 RAG 通過更深化的技術細

2024-05-22 21:25:18

站在岸上学不会游泳 | 算法校招生的高效成长总结

在這個由數據編織、由算法驅動的時代，AI大模型正成爲推動社會進步的重要力量。我們不僅是變革的見證者，更是推動者和塑造者。感謝零售UP技術人欄目的邀請，本文藉此機會回顧一下自己的算法之路上的一些故事和思考，希望能帶給讀者一些幫助。介紹自

2024-05-22 11:56:42

全球厂商之最，华为17篇论文入选国际数据库顶会ICDE

本文分享自華爲雲社區《全球廠商之最，華爲GaussDB&GeminiDB，17篇論文入選國際數據庫頂會ICDE》，作者：GaussDB 數據庫。 5月13-17日，國際數據庫頂級學術會議 ICDE 2024 於荷蘭烏得勒支舉行。華爲Gau

2024-05-22 10:58:13

Gen AI 连接非结构化数据，Unstructured Data Meetup 第二场官宣杭州！

定了！6 月 15 日，備受硅谷開發者喜愛的 Unstructured Data Meetup 第二場將在杭州舉辦！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 202

2024-05-20 21:25:07

基于Fluid与JindoCache的大模型训练加速实践

隨着人工智能技術的不斷髮展，深度學習模型變得越來越複雜，參數量動輒幾十億甚至上百億。這樣的“大模型”在帶來強大性能的同時，也對訓練過程提出了極高的要求。尤其是在數據加載和計算資源利用方面，傳統的訓練方法往往難以滿足快速、高效的需求。爲此，我

2024-05-28 12:12:15

【终极指南】使用Python可视化分析文本情感倾向

本文分享自華爲雲社區《Python理解文本情感傾向的終極指南》，作者：檸檬味擁抱。情感分析是一種通過自然語言處理技術來識別、提取和量化文本中的情感傾向的方法。Python在這一領域有着豐富的庫和工具，如NLTK、TextBlob和VAD

2024-05-28 10:58:03

解读注意力机制原理，教你使用Python实现深度学习模型

本文分享自華爲雲社區《使用Python實現深度學習模型：注意力機制（Attention）》，作者：Echo_Wish。在深度學習的世界裏，注意力機制（Attention Mechanism）是一種強大的技術，被廣泛應用於自然語言處理（NL

2024-05-27 10:58:44

智能测试持续加码，大模型引领软件测试新生态

在軟件行業日新月異的今天，智能測試已成爲提升軟件質量的關鍵環節。大模型的崛起，更是爲軟件測試帶來了前所未有的變革。隨着AI和ML技術的突飛猛進，智能測試得到了快速發展，實現了對測試過程的自動化和智能化管理，顯著提高了測試效率和質量。如今，智

2024-05-25 02:07:17

智能高效的IDE GoLand v2024.1全新发布 - 进一步升级AI辅助工具

GoLand 使 Go 代碼的閱讀、編寫和更改變得非常容易。即時錯誤檢測和修復建議，通過一步撤消快速安全重構，智能代碼完成，死代碼檢測和文檔提示幫助所有 Go 開發人員，從新手到經驗豐富的專業人士，創建快速、高效、和可靠的代碼。立即獲取G

2024-05-21 12:19:26

5月21日相聚上海张江！与文心大模型一起共建大模型产业应用生态圈

5月21日，文心中國行將走進上海，在張江科學會堂舉行。屆時，政府、企業與高校的相關專家和業界同仁將現場分享生成式人工智能與大模型最新進展，主要圍繞大模型技術如何賦能產業級應用創新展開探討，還有百度風投從投資視角帶來的觀點，讓參會者全方位瞭解

2024-05-17 00:28:21

24小時熱門文章

最新文章

最新評論文章