樣本的統計量
設隨機變量
1. 樣本均值爲:
2. 樣本的方差爲:
樣本方差的分母使用
樣本的矩
k 階樣本原點矩Ak=1n∑i=1nXki k 階樣本中心矩Mk=1n∑i=1n(Xi−X¯¯¯)k
矩估計
矩估計,即矩估計法,也稱“矩法估計”,就是利用樣本矩來估計總體中相應的參數。首先推導涉及感興趣的參數的總體矩(即所考慮的隨機變量的冪的期望值)的方程。然後取出一個樣本並從這個樣本估計總體矩。接着使用樣本矩取代(未知的)總體矩,解出感興趣的參數。從而得到那些參數的估計。
1. 設總體的期望爲
原點矩表達式:
根據該總體的一組樣本,求得原點矩:
2. 矩估計的結論:
1. 根據各自階的中心矩相等,計算得到:
2. 由於是根據樣本求得的估計結果,根據記號習慣,寫作:
3. 正態分佈的矩估計
在正態分佈的總體中採樣得到n個樣本:
4. 均勻分佈的矩估計
設
矩估計要求滿足:
從而:
貝葉斯估計和最大似然估計
這部分內容轉載自這裏
最大似然估計(Maximum Likehood Estimation MLE)
最大似然估計的核心思想是:找到參數θ的一個估計值,使得當前樣本出現的可能性最大。簡單說來就是:誰大像誰!
假設有一組獨立同分布
最大似然估計會尋找關於θ 的最可能的值,即在所有可能的 θ 取值中,尋找一個值使這個採樣的“可能性”最大化!
因爲是”模型已定,參數未知”,此時我們是根據樣本採樣
實際使用中,因爲f(xi|θ)一般比較小,而且n往往會比較大,連乘容易造成浮點運算下溢。所以一般我們用對數似然函數(用對數的好處:對數函數與原函數增減性相同,而且求導方便):
那最終
根據前面的描述,總結一下求最大釋然估計值的步驟:
1. 寫似然函數
2. 一般對似然函數取對數,並將對數似然函數整理
3. 對數似然函數求導,令導數爲0,求得似然方程
4. 根據似然方程求解,得到的參數即爲所求估計值
對數似然求解實例
問:假如有一個罐子,裏面有黑白兩種顏色的球,數目多少不知,兩種顏色的比例也不知。我 們想知道罐中白球和黑球的比例,但我們不能把罐中的球全部拿出來數。現在我們可以每次任意從已經搖勻的罐中拿一個球出來,記錄球的顏色,然後把拿出來的球 再放回罐中。這個過程可以重複,我們可以用記錄的球的顏色來估計罐中黑白球的比例。假如在前面的一百次重複記錄中,有七十次是白球,請問罐中白球所佔的比例最有可能是多少?
解:我們假設罐中白球的比例是
按照第二部分提到的似然估計求解過程,先寫出似然函數:
接下來對似然函數對數化:
然後求似然方程:
最後求解似然方程,得:
以上就是最大似然估計的詳細完整過程!
貝葉斯估計
統計學裏有兩個大的流派,一個是頻率派,一個是貝葉斯派。時至今日,這兩派還未就各自的觀點達成統一。我們前面提到的最大似然估計就是頻率派的典型思路,接下來再看看貝葉斯派的思路,到底跟頻率派估計有何不同。
先來看幾個相關的小公式:
兩個隨機變量
如果x,y是獨立隨機變量,上面的式子可以表示爲:
那麼條件概率就可以表示爲:
對於一個完備事件組
由以上這些,可以得出貝葉斯公式:
其中,
MLE與Bayes的區別
通過觀察MLE與Bayes的公式,發現Bayes公式比MLE公式裏就多了一項
換句話說,最大似然估計沒有考慮模型本身的概率,或者說認爲模型出現的概率都相等。而貝葉斯估計將模型出現的概率用先驗概率的方式在計算過程中有所體現。
舉個大家上學時候就遇到的例子:
假如人們會感染一種病毒,有一種測試方法,在被測試者已感染這個病毒時,測試結果 爲陽性的概率爲95%。在被測試者沒有感染這個病毒時,測試結果爲陽性的概率爲2%。現在,有一個人的測試結果爲陽性,問這個人感染了病毒嗎?
如果用最大似然估計的方法,既然感染了病毒出現陽性的概率爲95%,沒感染出現陽性的概率爲2%,本着誰大像誰的原則,那我就認爲這個人已經感染了病毒。
但是如果用貝葉斯方法進行估計,如果我們得知有一個先驗概率,比如整體人羣中只有1%的人會感染此種病毒,那麼由貝葉斯公式:
其中,p(真陽性|檢測爲陽性)爲後驗概率,即我們通過檢測出爲陽性可以判斷爲真陽性的概率;
由此可見,在貝葉斯估計中,先驗概率對結果的影響很大。在這種場景下,採用貝葉斯估計似乎更爲合理一些。
最後來個總結:從本質上來說,最大似然是對點估計,貝葉斯推斷是對分佈估計。即,假設求解參數θ,最大似然是求出最有可能的θ值,而貝葉斯推斷則是求解θ的分佈。
Tips
MLE簡單又客觀,但是過分的客觀有時會導致過擬合(Over fitting)。在樣本點很少的情況下,MLE的效果並不好。比如我們前面舉的病毒的例子。在這種情況下,我們可以通過加入先驗,用貝葉斯估計進行計算。
貝葉斯估計最要命的問題是,實際應用場景中的先驗概率不是那麼好求,很多都是拍腦袋決定的。一旦是拍腦袋決定的,這玩意自然就不準;更有甚者,很多時候是爲了方便求解生造出來一個先驗。那既然這樣,要這個先驗還有什麼卵用呢?所以頻率派的支持者就揪住這點不放攻擊貝葉斯派。
在現在看來,Frequentist與Bayesian這兩派還將長期並存,在各自適合的領域發揮自己的作用。
方差與偏差
偏差(bias):描述的是預測值(估計值)的期望與真實值之間的差距。偏差越大,越偏離真實數據,如下圖第二行所示。
方差(Variance):描述的是預測值的變化範圍,離散程度,也就是離其期望值的距離。方差越大,數據的分佈越分散,如下圖右列所示。