MATLAB數據統計和分析:參數估計和假設檢驗

參數估計和假設檢驗

統計所研究的對象是受隨機因素影響的數據,是以概率論爲基礎的一門應用學科。統計推斷的基礎是描述性統計,也就是蒐集整理加工分析統計數據,使其系統化和條理化,以顯示出數據資料的趨勢、特徵和數量關係的過程。

掌握 參數估計假設檢驗 這兩個數理統計的最基本方法,方能有效地對數據進行描述和分析。



參數估計

參數估計包括 點估計區間估計.

1. 點估計

點估計是使用單個數值作爲參數的一種估計方式。點估計在抽樣推斷中 不考慮抽樣誤差 ,直接以抽樣指標代替全體指標。因爲個別樣本的抽樣指標不等於全體指標,因此用抽樣指標直接代替全體指標不可避免的會有誤差。目前使用較多的點估計方法是最大似然法和矩法。

1. 最大似然法

最大似然法是在待估參數的可能取值範圍內,挑選使似然函數值最大的參數值作爲最大似然估計量。

最大似然估計法得到的估計量通常不僅僅滿足無偏性、有效性等基本條件,還能保證其爲充分統計量,因此一般建議在點估計和區間估計中使用最大似然法。

MATLABMATLAB 使用函數 mlemle 進行最大似然估計:

phat = mle('dist',data)

使用 datadata 向量中的樣本數據,返回 distdist 指定的分佈的最大似然估計。


2. 矩法

矩估計,就是利用樣本矩來估計總體中相應的參數的方法。我們首先推導涉及感興趣的參數的總體矩(即所考慮的隨機變量的冪的期望值)的方程。然後取出一個樣本並從這個樣本估計總體矩。接着使用樣本矩取代(未知的)總體矩,解出感興趣的參數。從而得到那些參數的估計。

待估參數通常作爲總體原點矩或原點矩的函數,此時可以用該總體樣本的原點矩或樣本原點矩的函數值作爲待估參數的估計,稱這種方法爲矩法。

例如:樣本均值總是總體均值的矩估計量、樣本方差是總體方差的矩估計量,樣本標準差是總體標準差的矩估計量。

MATLABMATLAB 中計算矩的函數爲 moment(X,order)moment(X,order).


2. 區間估計

區間估計是在點估計的基礎上,通過給出總體參數估計的一個區間範圍(該區間通常由樣本統計量加減估計誤差得到)從而減少誤差的估計方法。

求參數的區間估計,首先需要求出該參數的點估計,隨後構造一個含有該參數的隨機量,並根據一定的置信水平求該估計值的範圍。

MATLABMATLAB 中使用 mlemle 函數進行最大似然估計時,有如下幾種調用格式:

1. [phat,pci] = mle('dist',data)
2. [phat,pci] = mle('dist',data,alpha)
3. [phat,pci] = mle('dist',data,alpha,p1)
  1. 返回最大似然估計和 95%95\% 置信區間。
  2. 返回指定分佈的最大似然估計值和 100(1alpha)%100(1-alpha)\% 置信區間。
  3. 該形式只用於二項分佈,其中 p1p1 爲試驗次數。

假設檢驗

在總體分佈函數完全或部分未知時,爲推斷總體的某些性質,我們需要提出關於總體的假設。爲了確定所提出的假設是否合理,我們還需要對其進行檢驗。

1. 方差已知時的均值假設檢驗

在給定方差的條件下,我們可以使用 ztestztest 函數檢驗單樣本數據是否服從給定均值的正態分佈。

1. h = ztest(x,m,sigma)
2. h = ztest(x,m,sigma,alpha)
3. [h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail)
  1. 0.050.05 的顯著性水平下進行 zz 檢驗,以確定服從正態分佈的樣本均值是否爲 mm,其中 sigmasigma 爲標準差。
  2. 給出顯著性水平的控制參數 alphaalpha. 若 alpha=0.01alpha = 0.01,則當結果爲 h=1h = 1 時,可在 0.010.01 的顯著性水平上拒絕零假設;若 h=0h = 0,則不能在該水平上拒絕零假設。
  3. 允許指定是進行單側檢驗還是進行雙側檢驗。

    tail=0tail = 0both'both' 時表示指定備擇假設均值不等於 mm
    tail=1tail = 1right'right' 時表示指定備擇假設均值大於 mm
    tail=1tail = -1left'left' 時表示指定備擇假設均值小於 mm
    cici 爲均值真值的 1alpha1-alpha 置信區間,zvalzval 是統計量 z=xmσ/nz = \frac{\overline{x}-m}{\sigma / \sqrt{n}} 的值。

2. 正態總體均值假設檢驗

在數理統計中,正態總體均值檢測包括方差未知時單個正態總體均值的假設檢驗和兩個正態總體均值的假設檢驗。

  1. 方差未知時單個正態總體均值的假設檢驗

    tt 檢驗的特點是:在均方差未知的情況下,用小樣本檢驗總體參數,可檢驗樣本平均數的顯著性。

    MATLABMATLAB 中,使用 ttestttest 進行樣本均值的 tt 檢驗。
 1. h = ttest(x,m)
 2. h = ttest(x,m,alpha)
 3. [h,sig,ci] = ttest(x,m,alpha,tail)
  1. 0.050.05 的顯著性水平下進行 tt 檢驗,以確定在標準差未知的情況下取自正態分佈的樣本均值是否爲 mm .
  2. 給定顯著性水平的控制參數 alphaalpha.
  3. 指定是進行單側檢驗還是進行雙側檢驗.

  1. 方差未知時兩個正態總體均值的假設檢驗

    在比較兩個獨立正態總體的均值時,可根據方差齊不齊的情況,應用不同的統計量進行檢驗。下面僅對方差齊的情況進行分析:

    我們使用 ttest2ttest2 函數對兩個樣本的均值差異進行 tt 檢驗:
1. h = ttest2(xy)
2. [h,significance,ci] = ttest2(x,y,alpha)
3. ttest2 = (x,y,alpha,tail)
  1. 假設 xxyy 是取自服從正態分佈的兩個樣本,在它們標準差未知但相等時檢驗它們的均值是否相等。當 h=1h = 1 時,可在 0.050.05 的水平下拒絕零假設;h=0h = 0 時,不能在該水平下拒絕零假設.
  2. 給定顯著性水平的控制參數 alphaalpha.
  3. 允許指定進行單側檢驗或雙側檢驗。
發佈了37 篇原創文章 · 獲贊 15 · 訪問量 8340
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章