我們從數據中能得到以下信息:
總體信息。總體所屬分佈或者所屬的分佈族帶來的信息;
樣本信息。從總體中抽樣得來的樣本給我們提供的信息;
- 以上兩種信息進行的統計推斷稱爲經典統計學。它的觀點是把樣本看成來自具有一定概率分佈的總體。
先驗信息。在抽樣之前,對總體的基本認知,一般來自經驗或歷史資料。
- 利用以上三種信息進行的統計推斷稱爲貝葉斯統計。它的觀點是:任一未知量θ都可看做一個隨機變量,應用一個概率分佈去描述對θ的未知狀況。這個概率分佈是在抽樣前就有的關於θ的先驗信息的概率陳述。這個分佈被稱之爲先驗(
Prior
)分佈。
關於未知量θ的一些討論:
- 依賴於參數θ的密度函數在經典統計中記爲p(x;θ)或pθ(x),它表示在參數空間Θ={θ}中不同的θ對應不同的分佈。可以在貝葉斯統計中記爲p(x∣θ),他表示在隨機變量θ給定某個值時,總體指標X的條件分佈。
- 根據參數θ的先驗信息確定先驗分佈π(θ)。
- 從貝葉斯的觀點看,樣本x=(x1,⋅⋅⋅Xn,⋅⋅⋅)的產生分兩步進行。首先設想從先驗分佈π(θ)產生一個樣本θ,這一步是“老天爺”做的,人們是看不到的,故用“設想”二字。第二步是從總體分佈p(x∣θ)產生一個樣本x=(x1,⋅⋅⋅xn,⋅⋅⋅),這個樣本是具體的,人們能看得到的,此樣本x發生的概率是與如下聯合密函數成正比。p(x∣θi)=∏i=1np(xi∣θi)這個聯合密度函數是綜合了總體信息和樣本信息,常稱爲似然函數,記爲L(θi)。頻率學派和貝葉斯學派都承認似然函數,二派認位:在有了樣本觀察值x=(x1,⋅⋅⋅xn,⋅⋅⋅)後,總體和樣本所含θ的信息都被包含在似然函數L(θi)之中,可在使用似然函數做統計推斷時,兩派還是有差異的。
- 由於θ是設想出來的,他仍然是未知的,他是按先驗分佈π(θ)而產生的,要把先驗信息進行綜合,不能只考慮θ,而應對θ的一切可能加以考慮。故要用π(θ)參與進一步綜合。這樣一來,樣本x和參數θ的聯合分佈h(x,θ)=p(x∣θ)π(θ)把三種可用的信息都綜合進去了。
- 我們的任務是要對未知數θ做出統計推斷。在沒有樣本信息時,人們只能根據先驗分佈對θ做出判斷。在有樣本觀察值x=(x1,⋅⋅⋅xn,⋅⋅⋅)後,我們應該依據h(x,θ)對θ作出推斷。爲此我們需要把h(x,θ)作如下分解:h(x,θ)=π(θ∣x)m(x)其中m(x)是x的邊緣密度函數。m(x)=∫θh(x,∣θ)dθ=∫θp(x∣θ)π(θ)他與θ無關,或者說是,m(x)中不含θ的任何信息。因此能用來對θ做出推斷的僅是條件分佈π(θ∣x)。他的計算公式爲π(θ∣x)=m(x)h(x∣θ)=∫θp(x∣θ)π(θ)dθp(x∣θ)π(θ),這就是貝葉斯公式的密度函數形式。這個在樣本x給定下,θ的條件分佈被稱爲θ的後驗分佈。他是集中了總體、樣本和先驗三種信息中包含有θ的一切信息,而又是排除一切與θ無關的信息之後所得到的結果。故基於後驗分佈π(θ∣x)對θ進行統計推斷是更爲有效,也是合理的。
- 在θ是離散隨機變量時,先驗分佈可用先驗分佈列pi(θi),i=1,2⋅⋅⋅,表示。這時後驗分佈也是離散形式。π(θi∣x)=∑ip(x∣θi)π(θi)p(x∣θi)π(θi),i=1,2,⋅⋅⋅假如總體X也是離散的,那麼只要把密度安徽省農戶p(x∣θ)看作是概率函數P(X=x∣θ)即可。
一般來說,先驗分佈π(θ)是反映人們在抽樣分佈前對θ的認識,後驗分佈π(θ∣x)是反映人們在抽樣後θ的認識。之間的差異是由於樣本x出現後人們對θ認識的一種調整。所以後驗分佈π(θ∣x)可以看作是人們用總體信息和樣本信息對先驗分佈π(θ)做調整的結果。