變分自編碼器（VAE：Auto-Encoding Variational Bayes）

原創

2020-06-30 11:27

文章目錄

代碼實現： 基於tensorflow2.2實現，代碼見github。

參考文獻
1. Auto-Encoding Variational Bayes
2. 變分自編碼器VAE：原來是這麼一回事 | 附開源代碼

基於潛變量的生成模型

模型聯合概率分佈可表示爲 $p_{\bm\theta}(\bm x,\bm z)=p_\bm\theta(\bm x|\bm z)p_\bm \theta(\bm z)$ ，模型的生成過程爲
$\bm z\sim p_\bm \theta(\bm z) \implies \bm x\sim p_\bm \theta(\bm x|\bm z)$
考慮一個獨立同分布數據集 $X=\{\bm x^{(i)}\}_{i=1}^N$ ，我們假設數據的生成過程爲：

基於先驗分佈 $p_\bm \theta(\bm z)$ 生成隨機變量 $\bm z$ ；
基於條件概率分 $p_\bm \theta(\bm x|\bm z)$ 生成樣本 $\bm x$ ；

然而，我們很難獲取因變量 $\bm z$ 的分佈，如先驗概率分佈 $p_\bm \theta(\bm z|\bm x)=p_\bm \theta(\bm x|\bm z)p_\bm \theta(\bm z)/p_\bm \theta(\bm x)$ 難以計算。

使用後驗概率分佈 $q_\bm \phi(\bm z|\bm x)$ 作爲真實後驗概率分佈 $p_\bm \theta(\bm z|\bm x)$ 的近似，將 $q_\bm \phi(\bm z|\bm x)$ 可作爲編碼器，即給定樣本 $\bm x$ 下，生成包含所有可能的編碼 $\bm z$ ，並可通過編碼 $\bm z$ 重新生成樣本 $\bm x$ 。同樣地，將 $p_\bm \theta(\bm x|\bm z)$ 作爲解碼器，即給定編碼 $\bm z$ ，生成與 $\bm x$ 對應的分佈。

再看一下，傳統高斯混合模型的生成思想：

$p(x)=\sum_zp(z)p(x|z)$
式中 $p(z)\sim\mathcal N(0, I)$ ， $p(x|z)\sim\mathcal N(\mu(z),\sigma(z))$ 。

我們從標準正太分佈中採樣一個 $z$ ，再根據 $z$ 計算對應各高斯混合基模型的均值和方差，就可以利用高斯混合模型生成 $x$ 。但是這種模型顯然沒有利用到監督樣本數據，即如何將採樣 $z$ 對應到 $x$ ？模型的損失函數是什麼？

VAE的思想是，每個樣本都有自己特定的正太分佈 $q(z|x)$ ，我們有理由學習一個解碼器/生成器，把從特定正太分佈採樣的 $z$ 還原爲 $x$ 。我們可從特定分佈 $q(z|x)$ 中隨機採樣，生成各式各樣與 $x$ 類似的樣本，爲了使模型具備通用生成能力（不根據真實樣本），我們希望所有的 $q(z|x)$ 都近似於標準正太分佈，這樣我們就可以從標準正太分佈中採樣，生成隨機樣本。

變分邊界與目標函數

獨立同分布數據集對數似然爲
$\log p_\bm \theta(\bm x^{(1)},\cdots,\bm x^{(N)})=\sum_\bm x\log p_\bm \theta(\bm x)$

對於單個樣本
$\begin{aligned} \log p_\bm \theta(\bm x) &=\int_\bm zq_\bm \phi(\bm z|\bm x)\log p_\bm \theta(\bm x)\text d\bm z\\[2ex] &=\int_\bm zq_\bm \phi(\bm z|\bm x)\log\left(\frac{p_\bm \theta(\bm z,\bm x)}{q_\bm \phi(\bm z|\bm x)}\frac{q_\bm \phi(\bm z|\bm x)}{p_\bm \theta(\bm z|\bm x)}\right)\text d\bm z\\[2ex] &=\int_\bm zq_\bm \phi(\bm z|\bm x)\log\left(\frac{p_\bm \theta(\bm x|\bm z)p_\bm \theta(\bm z)}{q_\bm \phi(\bm z|\bm x)}\right)\text d\bm z + \int_\bm zq_\bm \phi(\bm z|\bm x)\log\left(\frac{q_\bm \phi(\bm z|\bm x)}{p_\bm \theta(\bm z|\bm x)}\right)\text d\bm z\\[2ex] &=L_b+D_{KL}\Big(q_\bm \phi(\bm z|\bm x)\big|\big|p_\bm \theta(\bm z|\bm x)\Big)\\[2ex] &=-D_{KL}\Big(q_\bm \phi(\bm z|\bm x)\big|\big|p_\bm \theta(\bm z)\Big)+\Bbb E_{q_\bm \phi(\bm z|\bm x)}[\log p_\bm \theta(\bm x|\bm z)]+D_{KL}\Big(q_\bm \phi(\bm z|\bm x)\big|\big|p_\bm \theta(\bm z|\bm x)\Big) \end{aligned}$
因爲KL散度爲不小於0的距離度量，因此 $L_b$ 爲目標函數下界。因爲目標函數值與 $q_\bm\phi(\bm z|\bm x)$ 無關，調整 $q_\bm\phi(\bm z|\bm x)$ 最大化 $L_b$ ，目標函數值不改變，但目標函數第二項KL散度趨近於0，若繼續調整 $p_\bm\theta(\bm x|\bm z)$ 以最大化 $L_b$ ，則目標函數值很有可能增加。因此，最大化目標函數的下界 $L_b$ 即可，第三項KL散度可忽略。

VAE模型結構

訓練過程中，編碼器爲每個樣本 $\bm x$ 生成對應正太分佈的均值和方差，表示樣本來自於 $\mathcal N(\mu(z),\sigma(z))$ ，解碼器將從 $\mathcal N$ 中的採樣，重構回對應的樣本 $\bm x$ 。

同一樣本在不同mini-batch中對應不同的分佈，模型爲了更好重構，傾向於將編碼器輸出方差至爲0，這樣就喪失了隨機性，即模型喪失樣本生成能力，退化爲普通的AutoEncoder。因此，VAE約束所有編碼向量服從標準正太分佈，從而防止噪聲爲零。

由於
$-D_{KL}\Big(\mathcal N(\mu, \sigma^2\big|\big|\mathcal N(0, 1))\Big)=\frac{1}{2}\Big(\log\sigma^2-\mu^2-\sigma^2+1\Big)$
如果，我們強制令 $p_\theta(z)$ 服從標準正太分佈，最大化目標函數等價於最大化
$\frac{1}{2}\Big(-\log\sigma^2+\mu^2+\sigma^2-1\Big)+\Bbb E_{q_\bm \phi(\bm z|\bm x)}[\log p_\bm \theta(\bm x|\bm z)]$

其中，第一項爲 正則化損失，它有助於學習具有良好結構的潛在空間；第二項爲 重構損失，它迫使解碼後的樣本匹配初始輸入，如mnist數據集規範化爲[0, 1]區間，解碼器使用sigmoid輸出，則此項爲交叉熵。

此外，採樣操作不可導，模型實現使用 重參數技巧：
$\epsilon\sim\mathcal N(0, 1) \implies \mu+\epsilon\times \sigma \sim\mathcal N(\mu,\sigma^2)$
根據編碼器生成樣本的均值和方差，但是我們不能直接生成對應的正太分佈，再從中採樣作爲編碼器輸出，因爲採樣過程不可導。換種思路，從標準正太分佈中採樣數據（作爲樣本數據不參與求導），根據編碼器輸出將其變換到對應的正太分佈，再作爲編碼器輸出。

神經網絡實現VAE

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

變分自編碼器（VAE：Auto-Encoding Variational Bayes）

文章目錄

基於潛變量的生成模型

變分邊界與目標函數

VAE模型結構

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

變分自編碼器（VAE：Auto-Encoding Variational Bayes）

深度學習：生成對抗網絡（Generative Adversarial Nets, GANs）

依存句法解析：基於深層雙仿射注意力的神經網絡依存解析（Deep Biaffine Attention for Neural Dependency Parsing）

自然語言處理：機器翻譯模型（MT、NMT、Seq2Seq with Attention）

深度學習：正則化防止過擬合（L1、L2、Dropout）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結