參考
採樣在特徵學習中是重要的:論述採樣在特徵學習中的重要性,有實驗證明
不錯的講義:以下基礎部分主要參考這個文獻
蒙特卡洛採樣:蒙特卡洛採樣基礎參考這部分
Machine Learning_ A Probabilistic Perspective:MH算法的有效性證明參見本書24.3.6
馬爾可夫鏈及吉布斯抽樣 入門詳解(Markov Chain Monte Carlo and Gibbs Sampling):這個對於Gibbs採樣的想法說得很清楚
動機
給定某個分佈,如何生成足夠多的樣本?實際上,這是一箇中間問題,因爲有很多應用問題需要這一步進行近似推斷。
我們更需要關注如何應用採樣方法解決實際問題,而不是算法的證明。站在巨人的肩膀上,先理解如何熟練應用。一開始想着做本質改進,一般連最基礎的理解都達不到。
函數變換
如果則,理由如下:
即,的概率分佈函數爲,概率密度函數爲.
拒絕採樣
對於p(z),假設其非正規化版本更容易得到。我們找到一個常數和一個已知分佈使得總有
那麼,我們可以通過重複以下步驟進行採樣:
- 生成一個的樣本
- 生成一個的樣本
- 如果就保留,作爲一個所求樣本,否則捨棄,繼續上述步驟
重要性採樣
應用在對隨機變量期望的估計。期望爲
一般對分佈採取個樣本,使用
進行估計。
但是,我們可以使用另外更加容易採樣的分佈來做估計。對採取個樣本,然後使用下式
蒙特卡洛採樣
這裏我們只簡單表達它的思想和算法,證明去看Machine Learning_ A Probabilistic Perspective
馬爾科夫蒙特卡洛採樣算法(MCMC)的基本想法是,找到轉移概率,使得所採樣分佈爲對應馬爾科夫鏈的平穩分佈。
MH採樣算法
如果分佈滿足
時,就是轉移概率對應的馬爾科夫鏈的平穩分佈。
但是,這樣的轉移概率分佈是不容易的,我們使用一個先驗的轉移概率分佈
設爲非正規化分佈,選擇一個先驗的轉移概率分佈,通過一個接受率來進行修正。
Gibbs採樣算法
對於元分佈,可以使用本身構造轉移概率,得到Gibbs採樣算法