Variational Auto-Encoder （VAE）論文閱讀與公式推導

原創

2020-06-28 06:51

1.問題描述

給定一個數據集，假設其滿足樣本間獨立同分布。本質上，我們希望得到關於該數據集的真實的概率分佈p(x)，雖然有一些方法能夠直接估計p(x)中某一點的概率（例如核密度估計、近鄰方法），但這些方法一方面準確性較差，並且隨着樣本維度的升高，對樣本數量的需求也是指數增加的。簡單來說，我們多數情況下無法知道p(x)。

那麼換一個思路，假設每個樣本是由一組潛在的因素決定，這些因素我們很難明確他們的含義，但他們確確實實地決定這些樣本的分佈，令這些隱變量爲z。需要說明的是，有些時候，隱變量是一個確定的值，但在貝葉斯理論下，這些隱變量是一組隨機變量，他們也存在着各自對應的概率分佈。

通過上邊的描述，我們可知，隱變量z決定這隨機變量x的概率分佈，其概率圖模型如下：

當我們只關注上圖中的z，x和他們之間的實線箭頭，可知：

上式中，p(z)表示隱變量z的概率分佈，可知，對任意一個x的概率，都需要遍歷所有z的取值，這一複雜度隨z的維度指數上升，並且，我們也不知道z的真實分佈是什麼樣子的。

這裏，就可以利用貝葉斯的方法對z的分佈進行估計，即VAE首先令z的先驗分佈p(z)爲標準高斯分佈，之後，基於觀測到的X，計算其後驗分佈p(z|x)來估計z的真實分佈。而對後驗分佈的估計，也正是VAE的核心。注：原文中通過最大化p(X)對數似然，推導得出等價於優化變分下界，角度不同，本質一樣。

2.問題建模

爲了估計，VAE假設存在一個分佈，令q不斷近似p，即最小化,從而將一個估計問題轉化爲一個優化問題，這一過程本質上是一個變分推斷的過程，所以VAE不叫AE。接下來，具體來看如何優化.

基於上述推導，將p(z)=N(0,I)帶入上式，並變換一下可得：

3.求解優化目標1——

首先，需要明確VAE中直接認爲服從各分量相互獨立的多元高斯分佈，所以

上述積分可拆成三個積分，其中，第一項是概率密度乘一個和x無關的常數，即對概率密度積分，結果爲1，

第二項是正態分佈的二階矩，

第三項

-

其中J爲因變量z的維數綜上所述，

4.求解優化目標2——

而另一項，也就是，理論上來說，對它的計算也是要計算如下積分的

但通過一種叫重參數的技巧（reparameterization trick），可以構造一個簡單的式子作爲的近似值。

這樣一來，得到了如下形式

Bernouli分佈建模x

將x看做一組服從Bernouli分佈的隨機變量，pθx|z輸出的是一組Bernouli分佈的參數，假設爲y，對於x中的某個分量xi，存在着y中的一個分量yi與之對應。可知，

同一表達在一個式子中，就是

所以，有

其中，D爲數據的分量個數。

Gaussian分佈建模x

將x看做一組服從Gaussian分佈的隨機變量，輸出的是多元高斯分佈的均值與方差，假設分別爲μ和σ，則

5.一些實現細節

按照論文中的模型，模型均爲包含一個隱層的神經網絡，其中模型以x爲輸入，輸出一組μ和，這裏之所以輸出而不是，是因爲是非負的，這就需要對網絡加一些限制，爲了方便，改爲，從而正負都可以變換爲方差。

參考：

https://www.zhihu.com/question/41765860

https://blog.csdn.net/u012356619/article/details/102588314

https://github.com/wiseodd/generative-models/tree/master/VAE/vanilla_vae

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

芯片產業管理和營銷指北（3）—— 贏得客戶

注意：本文是依據俞志宏老師的《我在硅谷管芯片：芯片產品線經理生存指南》一書閱讀後歸納總結得到。可以試做此書的讀後感，對芯片產業感興趣的同僚強烈推薦此書爲什麼要見客戶和客戶面對面主要是獲取與客戶相關的各類信息，包含但不限於：市

2024-06-09 14:34:09

【stars-one】星念輕小說下載器

原文: 【stars-one】星念輕小說下載器-Stars-One的雜貨小窩一款將在線輕小說保存到本地的下載工具軟件介紹小說單卷下載小說全卷下載(需VIP) 多線程解析和下載下載導出爲epub文件自動更新軟件使用前需要進行

2024-06-09 14:22:28

shell編程相關的

shell腳本獲取腳本所在目錄執行腳本的父目錄不一定是當前的工作目錄。 url=$(dirname $(readlink -f $0))

2024-06-09 14:16:47

kvm鏈接克隆虛擬機遷移到openstack機器的實驗

總結如果是完整克隆的那種虛擬機，是可以直接在openstack使用的，如果鏡像格式沒問題的話。因爲kvm虛擬機大部分都是鏈接克隆出來的鏡像，不可用直接複製使用，所以需要創建新的鏡像文件創建空盤：qemu-img creat

2024-06-09 14:16:47

【Python】DQN處理CartPole-v1

DQN是強化學習中的一種方法，是對Q-Learning的擴展。通過引入深度神經網絡、經驗回放和目標網絡等技術，使得Q-Learning算法能夠在高維、連續的狀態空間中應用，解決了傳統Q-Learning方法在這些場景下的侷限性。 Q-Le

2024-06-09 14:14:07

P1355 神祕大三角（凸包）

P1355 神祕大三角 - 洛谷 | 計算機科學教育新生態 (luogu.com.cn) 隊友推薦的，算是入門凸包，就是用叉積判斷一下點是否相對每條邊都在凸包的邊的左側。 1 #include <bits/stdc++.h> 2

2024-06-09 14:13:17

前端使用 Konva 實現可視化設計器（13）- 折線 - 最優路徑應用【思路篇】

這一章把直線連接改爲折線連接，沿用原來連接點的關係信息。關於折線的計算，使用的是開源的 AStar 算法進行路徑規劃，啓發方式爲曼哈頓距離，且不允許對角線移動。請大家動動小手，給我一個免費的 Star 吧~ 大家如果發現了 Bug，歡

2024-06-09 14:10:57

生產計劃範圍的擴展 - 工單的拆分與合併

背景　　在過往與不少合作伙伴們，就生產計劃項目方案的討論中，經常提及這樣的一種情況： “我們在編制生產計劃時，有些數量較大的訂單，需要拆分成多個子訂單，這樣才能利用多個資源並行加工，以縮短生產週期，提高資源利用率” - 我們稱爲【工單拆分

2024-06-09 14:09:57

APS系統設計經驗分享(時間推導II - 2023.09)

　　在前一篇關於APS系統設計分享文章(《APS系統設計經驗分享(時間推導 - 2023.03)》)中，我們提到將會分享使用OptaPlanner作爲規劃引擎開發APS系統過程中，遇到的一些時間相關的設計建議與異常情況分析。後來一直忙於項目

2024-06-09 14:09:57

排程過程中任務鎖定的外延與內涵

在生產排程過程中，除了可以藉助強大的算法，與優質的規劃模型對待排任務進行排產優化外，還會遇到一些需要人爲鎖定部分任務的情況。無論是APS系統開發人員，還是排產作業人員，在常見的認識中，對於“鎖定”概念的理解，第一反應就是把任務固定到某個資源

2024-06-09 14:09:57

排程系統中關於任務優先級的需求延伸與設計構思

無論是面向銷售訂單的MPS，還是基於多工序制約關係的APS，還是具體車間生產中針對單一工序的任務作業調度優化，都存在基於被排程對象(例如銷售訂單、生產工單、工序任務)的優先級進行優化的需求場景。當我們僅在宏觀、較高層次的角度考慮，任務優先級

2024-06-09 14:09:57

從零手寫實現 nginx-11-文件處理邏輯與 range 範圍查詢合併

前言大家好，我是老馬。很高興遇到你。我們爲 java 開發者實現了 java 版本的 nginx https://github.com/houbb/nginx4j 如果你想知道 servlet 如何處理的，可以參考我的另一個項目：

2024-06-09 14:02:36

nginx快速分析日誌並找出攻擊IP

第一步：分析NGINX日誌分析日誌主要目的是尋找那些異常活躍的IP地址，通過以下命令可以快速找出。 cat access.log | awk '{print$1}' |sort|uniq -c|sort -rn|head -10 命

2024-06-09 13:59:16

Vue CLI 4與項目構建實戰指南

title: Vue CLI 4與項目構建實戰指南 date: 2024/6/9 updated: 2024/6/9 excerpt: 這篇文章介紹瞭如何使用Vue CLI優化項目構建配置，提高開發效率，涉及配置管理、項目部署策略、插件系

2024-06-09 13:40:15

Vue第三方庫與插件實戰手冊

title: Vue第三方庫與插件實戰手冊 date: 2024/6/8 updated: 2024/6/8 excerpt: 這篇文章介紹瞭如何在Vue框架中實現數據的高效驗證與處理，以及如何集成ECharts、D3.js、Chart.

2024-06-09 13:40:15

24小時熱門文章

最新文章

最新評論文章