[統計學筆記] (六) 參數估計

(六)參數估計 (Parameter Estimation)

參數估計是推斷統計的重要內容之一。它是在抽樣及抽樣分佈的基礎上,根據樣本統計量來推斷所關心的總體參數。

人們常常需要根據手中的數據,分析或推斷數據反映的本質規律。即根據樣本數據如何選擇統計量去推斷總體的分佈或數字特徵等。統計推斷是數理統計研究的核心問題所謂統計推斷是指根據樣本對總體分佈或分佈的數字特徵等作出合理的推斷。它是統計推斷的一種基本形式,是數理統計學的一個重要分支,分爲點估計和區間估計兩部分

參數估計(Parameter Estimation),統計推斷的一種。根據從總體中抽取的隨機樣本來估計總體分佈中未知參數的過程。例如:用樣本平均值\large \overline{x}估計總體均值\large \mu,用樣本比例\large p估計總體比例\large \pi,用樣本方差\large s^{2}估計總體方差\large \sigma ^{2},等等。

從估計形式看,區分爲點估計與區間估計:從構造估計量的方法講,有矩法估計、最小二乘估計、似然估計、貝葉斯估計等。

參數估計有多種方法,有矩估計、極大似然法、一致最小方差無偏估計、最小風險估計、同變估計、最小二乘法、貝葉斯估計、極大驗後法、最小風險法和極小化極大熵法等。最基本的方法是最小二乘法和極大似然法

要處理兩個問題:(1)求出未知參數的估計量;(2)在一定信度(可靠程度)下指出所求的估計量的精度。信度一般用概率表示,如可信程度爲95%;精度用估計量與被估參數(或待估參數)之間的接近程度或誤差來度量。

 

主要分類


點估計
點估計(Point Estimate)是用樣本統計量的某個取值直接作爲總體參數的估計值。例如,用樣本均值x直接作爲總體均值μ的估計值,用樣本方差s^{^{2}}直接作爲總體方差\sigma ^{^{2}}的估計值。點估計的方法有:矩估計法、順序統計量法、最大似然法、最小二乘法。

點估計是以抽樣得到的樣本指標作爲總體指標的估計量,並以樣本指標的實際值直接作爲總體未知參數的估計值的一種推斷方法。通常它們是總體的某個特徵值,如數學期望、方差和相關係數等。

點估計問題就是要構造一個只依賴於樣本的量,作爲未知參數或未知參數的函數的估計值。例如,設一批產品的廢品率爲\theta。爲估計\theta,從這批產品中隨機地抽出n個作檢查,以X記其中的廢品個數,用X/n估計θ,這就是一個點估計。


構造點估計常用的方法是:
① 矩估計法。用樣本矩估計總體矩,從而得到總體分佈中參數的一種估計。它的思想實質是用樣本的經驗分佈和樣本矩去替換總體的分佈和總體矩。矩估計法的優點是簡單易行, 並不需要事先知道總體是什麼分佈。缺點是,當總體類型已知時,沒有充分利用分佈提供的信息。一般場合下,矩估計量不具有唯一性。

矩是指以期望爲基礎而定義的數字特徵,一般分爲原點矩和中心矩。設X爲隨機變量,對任意正整數k,稱E(Xk)爲隨機變量X的k階原點矩,記爲:

當k=1時,m1=E(X)=μ,可見一階原點矩爲隨機變量X的數學期望。

把Ck=E[X-E(X)]k稱爲以E(X)爲中心的k階中心矩。顯然,當k=2時,C2=E[X-E(x)]2=σ2,可見二階中心矩爲隨機變量X的方差。

②最大似然估計法(Maximum Likelihood)。於1912年由英國統計學家R.A.費希爾提出,利用樣本分佈密度構造似然函數來求出參數的最大似然估計。它用來求一個樣本集的相關概率密度函數的參數。


③最小二乘法(generalized least squares)。主要用於線性統計模型中的參數估計問題。最小二乘法是一種數學優化技術,它通過最小化誤差的平方和找到一組數據的最佳函數匹配。 最小二乘法是用最簡的方法求得一些絕對不可知的真值,而令誤差平方之和爲最小。 最小二乘法通常用於曲線擬合。很多其他的優化問題也可通過最小化能量或最大化熵用最小二乘形式表達。


④貝葉斯估計法。基於貝葉斯學派(見貝葉斯統計)的觀點而提出的估計法。可以用來估計未知參數的估計量很多,於是產生了怎樣選擇一個優良估計量的問題。首先必須對優良性定出準則,這種準則是不唯一的,可以根據實際問題和理論研究的方便進行選擇。優良性準則有兩大類:一類是小樣本準則,即在樣本大小固定時的優良性準則;另一類是大樣本準則,即在樣本大小趨於無窮時的優良性準則。最重要的小樣本優良性準則是無偏性及與此相關的一致最小方差無偏估計,其次有容許性準則,最小化最大準則,最優同變準則等。大樣本優良性準則有相合性、最優漸近正態估計和漸近有效估計等  。


區間估計

區間估計(Interval Estimation)是依據抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,作爲總體分佈的未知參數或參數的函數的真值所在範圍的估計。例如人們常說的有百分之多少的把握保證某值在某個範圍內,即是區間估計的最簡單的應用。1934年統計學家 J.奈曼創立了一種嚴格的區間估計理論。

區間估計示意圖

可以求出樣本均值\large \overline{x}落在總體均值\large \mu的兩側任何一個抽樣標準差範圍內的概率。但是實際估計時,情況恰恰相反。\large \overline{x}是已知的,而\large \mu是未知的,也正是要估計的。由於\large \overline{x}\large \mu的距離是對稱的,如果某個樣本的平均值落在\large \mu的兩個標準差範圍之內,反過來,\large \mu也就被包括在以\large \overline{x}爲中心左右兩個標準差的範圍內。因此約有95%的樣本均值所構造的兩個標準差的區間會包括\large \mu

通俗地說,如果抽取100個樣本來估計總體的均值,由100個樣本所構造的100個區間中,約有95個區間包含總體均值,另外5個區間則不包含總體均值。

區間估計是在點估計的基礎上,給出總體參數估計的一個區間範圍,該區間通常由樣本統計量加減估計誤差得到。與點估計不同,進行區間估計時,根據樣本統計量的抽樣分佈可以對樣本統計量與總體參數的接近程度給出一個概率度量。

區間估計中,由樣本統計量所構造的總體參數的估計區間稱爲置信區間(Confidence Interval),其中區間的最小值稱爲置信下限,最大值稱爲置信上限。

如果將構造置信區間的步驟重複多次,置信區間中包含總體參數真值的次數所佔的比例稱爲置信水平(Confidence Level),也稱爲置信度或置信係數(Confidence Coefficient)。

在構造置信區間時,可以用所希望的任意值作爲置信水平。比較常用的置信水平及正態分佈曲線下右側面積爲\large \alpha /2時的\large z值(\large z_{\alpha /2}),如下表所示:

置信水平 \large \alpha \large \alpha /2 \large z_{\alpha /2}
90% 0.10 0.05 1.645
95% 0.05 0.025 1.96
99% 0.01 0.005 2.58

區間估計的正確理解方式:區間估計並不是總體參數落在某個區間的概率,而是抽取的多個樣本中有多大的概率包含總體參數,由此通過概率可以知道在多次抽樣得到的區間中大概有多少個區間包含了參數的真值。

如何理解 95%的置信水平的含義?

可以參考博文:如何理解 95% 置信區間? https://www.zhihu.com/question/26419030

 

求置信區間常用的三種方法:
①利用已知的抽樣分佈。例如,設x1,x2,…,xn爲正態總體N(μ,σ2)中抽出的樣本,要作μ的區間估計,則服從自由度爲n-1的t分佈。指定α>0,找這個分佈的上α/2分位數tα/2(n-1),則有即由此得到 μ 的一個置信係數爲 1-α 的置信區間。


②利用區間估計與假設檢驗的聯繫。設要作θ的置信係數爲1-α 的區間估計,對於任意的θ0,考慮原假設爲 H:θ=θ0,備擇假設爲 K:θ≠θ0。設有一水平爲α 的檢驗,它當樣本X屬於集合A( θ0)時接受H。若集合{θ0∶X∈A(θ0)}是一個區間,則它就是θ的一個置信區間,其置信係數爲1-α。就上例而言,對假設H:μ=μ0的檢驗常用t檢驗:當時接受μ=μ0,集合即爲區間。這正是前面定出的μ的置信區間。若要求θ的置信下限(或上限),則取原假設爲θ≤θ0(或θ≥θ0),備擇假設爲θ>;θ0(或θ<;θ0),按照同樣的方法可得到所要求的置信下(上)限。


③利用大樣本理論。例如,設x1,x2,…,xn爲抽自參數爲p的二點分佈的樣本,當n→∞時,依分佈收斂(見概率論中的收斂)於標準正態分佈N(0,1),以 uα/2記N (0,1)的上 α/2分位數。所以,可作爲p的一個區間估計,上面的極限值1-α就定義爲它的漸近置信係數。


評價置信區間的好壞有兩個因素:一是其精度,可以用區間的長度來刻畫,長度越長,精度越低。另一個因素是置信度,在樣本容量固定時,當置信度增大,此時置信區間的長度變大,即置信區間的置信度越高,則精度越低,反之,精度越高則置信度越低。


遞推參數估計
還有一種遞推參數估計。爲了減少計算量,便於在線估計參數,產生了許多遞推算法。一般是用遞推算法估計動態系統的參數。方法是:利用時刻t上的參數估計 、存儲向量xt與時刻t+1上的輸入和輸出數據ut+1和yt+1,計算新的參數值。每一步的計算時間比解一個線性代數方程組要少得多。


最小二乘法和極大似然法都有遞推形式,另外還有遞推廣義最小二乘法、遞推輔助變量法和遞推增廣最小二乘法等,都是遞推最小二乘法的改進形式,可以用來估計帶有色噪聲干擾的系統。此外,隨機逼近算法、卡爾曼濾波法和朗道遞推估計,是從不同的出發點得到的遞推參數估計法(見遞推估計算法),大多數遞推參數估計算法的一致性,即,可以用鞅收斂性、常微分方程穩定性和超穩定性、正實性分別證明。
參數估計的方法很多,如何統一它們,如何在實踐中簡單有效地判斷它們的性質以及產生新的方法,都是有待進一步探討的問題 。 


一個總體參數的區間估計

研究一個總體時,所關心的參數主要有總體均值\mu、總體比例\pi和總體方差\sigma ^{2}等。

1. 總體均值的區間估計

對總體均值進行區間估計時,需要考慮總體是否爲正態分佈,總體方差是否已知,用於構造估計量的樣本是大樣本(通常要求n≥30)還是小樣本(n<30)等幾種情況。下面分兩種情況來分析:

(1)正態總體、方差已知,或非正態總體、大樣本

當總體服從正態分佈且方差已知,或總體非正態分佈但樣本爲大樣本時,樣本均值x的抽樣分佈服從正態分佈,其數學期望爲總體均值μ,方差爲σ2/n。樣本均值經過標準化後的隨機變量則服從正態分佈,即

根據式上式和正態分佈的性質可以得出總體均值μ在1-α置信水平下的置信區間爲:

​    

(2)正態總體、方差未知、小樣本

在總體服從正態分佈的情況下,如果總體方差σ2未知,且樣本較小的情況下,需要用樣本方差s2代替σ2。這時,樣本均值經過標準化以後的隨機變量服從自由度爲(n-1)的t分佈,即


因此需要採用t分佈來建立總體均值μ的置信區間。根據t分佈建立的總體均值μ在1-α置信水平下的置信區間爲:

​    

2. 總體比例的區間估計

在大樣本的前提下,樣本比例p的抽樣分佈可用正態分佈近似。p的數學期望爲E§=π,p的方差爲σ2p=π(1-π)/n。而樣本比例經標準化後的隨機變量則服從標準正態分佈,即

與總體均值的區間估計類似,在樣本比例p的基礎上加減估計誤差zα/2σp,即得總體比例π在1-α置信水平下的置信區間爲:

當通過上式計算總體比例π的置信區間時,\pi值應該是已知的。但實際情況不然,π值恰好是要估計的,所以需要用樣本比例p來代替\pi。這種情況下,總體比例的置信區間可表示爲:
   
 
​3. 總體方差的區間估計

對於總體方差的估計,這裏只討論正態總體方差的估計。根據樣本方差的抽樣分佈可知,樣本方差服從自由度爲n-1\chi ^{^{2}}分佈。因此用\chi ^{^{2}}分佈構造總體方差的置信區間。

總體方差\sigma ^{2}1-\alpha置信水平下的置信區間爲:

 一個總體參數的估計及所使用的分佈

兩個總體參數的區間估計後續討論。

一個總體參數的區間估計

參數 點估計量(值) 標準誤差 \left ( 1-\alpha \right ) % 的置信區間 假定條件
\mu 總體均值 \overline{x} \frac{\sigma }{\sqrt{n}}\sigma / \sqrt{n} \overline{x}\pm z_{\alpha /2}\frac{\sigma }{\sqrt{n}}

(1) \sigma 已知

(2) 大樣本 n\geq 30

\overline{x}\pm z_{\alpha /2}\frac{s }{\sqrt{n}}

(1) \sigma 未知

(2) 大樣本 n\geq 30

\overline{x} \frac{\sigma }{\sqrt{n}} \overline{x}\pm t_{\alpha /2}\frac{s }{\sqrt{n}}

(1) 正態分佈

(2) \sigma 未知

(2) 小樣本 n< 30

\pi 總體比例 p \sqrt{\frac{\pi \left ( 1-\pi \right )}{n}} p\pm z_{\alpha /2}\sqrt{\frac{p\left ( 1-p \right )}{n}}

(1) 二項總體

(2) 大樣本 (np\geq 5n\left ( 1-p \right )\geq 5

\sigma ^{2} 總體方差 s^{2} (不要求) \frac{\left ( n-1 \right )^{2}s^{2}}{\chi _{\alpha /2}^{2}} \leq \sigma ^{2}\leq \frac{\left ( n-1 \right )^{2}s^{2}}{\chi _{1-\alpha /2}^{2}} 正態總體

兩個總體參數的區間估計

對於兩個總體,所關心的參數主要有兩個總體的均值之差 \mu _{1} - \mu _{2}、兩個總體的比例之差 \pi_{1} - \pi_{2}、兩個總體的方差比 \sigma _{1}^{2} / \sigma _{2}^{2}等。

兩個總體均值之差的區間估計

兩個總體比例之差的區間估計

兩個總體方差紙幣的區間估計


樣本量的確定

通過區間估計可以瞭解到樣本量的選擇對於問題的求解至關重要,大樣本(n≥30)和小樣本(n<30)求解的方法不同。同樣是大樣本選擇多大的樣本來估計參數比較合適?

通常,樣本量的確定與可以容忍的置信區間的寬度以及對此區間設置的置信水平有一定關係。因此如何確定一個適當的樣本量,也是抽樣估計中需要考慮的問題。

置信區間和樣本容量之間的關係

樣本量與置信水平成正比,在其他條件不變的情況下,置信水平越大,所需要的樣本量也就越大。

反過來,在置信水平不變的情況下,樣本容量越大,置信區間越寬。(這個問題經常被問到。)

參考公式:

 

估計總體均值時樣本量的確定

總體均值的置信區間是由樣本均值x和估計誤差兩部分組成的。在重複抽樣或無限總體抽樣條件下,估計誤差爲:

​其中z_{\alpha /2}的值和樣本n共同確定了估計誤差的大小。當確定了置信水平1-α,z_{\alpha /2}的值就確定了。對於給定的z_{\alpha /2}的值和總體標準差σ,就可以確定任一希望的估計誤差所需要的樣本量。令E代表所希望達到的估計誤差,即:

​    

通過上式可以推導出確定樣本量的公式如下:

​式中的E值是使用者在給定的置信水平下可以接受的估計誤差,z_{\alpha /2}的值可直接由區間估計中所用到的置信水平確定。當σ未知時,可以用樣本的標準差來代替;也可以用試驗調查的辦法,選擇一個初始樣本,以該樣本的標準差作爲σ的估計值。

從上式可以看出,樣本量與置信水平成正比,在其他條件不變的情況下,置信水平越大,所需要的樣本量也就越大;樣本量與總體方差成正比,總體的差異越大,所要求的樣本量也越大;樣本量與估計誤差的平方成反比,即可以接受的估計誤差的平方越大,所需的樣本量就越小。

估計總體比例時樣本量的確定

與估計總體均值時樣本量確定的方法類似,在重複抽樣或無限總體抽樣條件下,估計總體比例置信區間的估計誤差爲:

 由上式可知,z_{\alpha /2}的值、總體比例π和樣本量n共同確定了估計誤差的大小。令E代表所希望達到的估計誤差,即:

據此可以推導出重複抽樣或無限總體抽樣條件下確定樣本量的公式如下:

式中的估計誤差E必須是使用者事先確定的,大多數情況下,一般取E的值小0.10。z_{\alpha /2}的值可直接由區間估計中所用導的置信水平確定。如果π未知,可以用類似的樣本比例來代替;也可以用試驗調查的辦法,選擇一個初始樣本,以該樣本的比例作爲π的估計值。當π的值無法知道時,通常取使π(1-π)最大時的0.5。 


參數估計與假設檢驗


統計推斷是由樣本的信息來推測母體性能的一種方法,它又可以分爲兩類問題,即參數估計和假設檢驗。實際生產和科學實驗中,大量的問題是在獲得一批數據後,要對母體的某一參數進行估計和檢驗。


例如,我們對45鋼的斷裂韌性作了測定,取得了一批數據,然後要求45鋼斷裂韌性的平均值,或要求45鋼斷裂韌性的單側下限值,或要求45鋼斷裂韌性的分散度(即離散係數),這就是參數估計的問題。


又如,經過長期的積累,知道了某材料的斷裂韌性的平均值和標準差,經改進熱處理後,又測得一批數據,試問新工藝與老工藝相比是否有顯著差異,這就是假設檢驗的問題。


這樣可以看出,參數估計是假設檢驗的第一步,沒有參數估計,也就無法完成假設檢驗 。


典型計算題

第 1 題

一家食品生產企業以生產袋裝食品爲主,每天的產量大約爲8000袋。按規定每袋的重量應爲100克。爲對產品重量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取25袋,測得每袋重量如下表所示:

112.5 101.0 103.0 102.0 100.5
102.6 107.5 95.0 108.8 115.6
100.0 123.5 102.0 101.6 102.2
116.6 95.4 97.8 108.6 105.0
136.8 102.8 101.5 98.4 93.3

已知產品重量服從正態分佈,且總體標準差爲10克。試估計該天產品平均重量的置信區間,置信水平爲95%。

解答:

根據題意已知:總體標準差爲:\large \sigma = 10\large n=25,置信水平 \large 1-\alpha = 95%,查標準正態分佈表得:\large z_{\alpha /2} = 1.96

根據樣本數據計算的樣本均值爲:

\large \overline{x} = \frac{\sum_{i=1}^{n}x_{i}}{n} =\frac{2634}{25}= 105.36

根據正態分佈的性質可以得出總體均值\large \mu在 \large 1-\alpha置信水平下的置信區間爲:\large \overline{x}\pm z_{\alpha /2}\frac{\sigma }{\sqrt{n}},即

\large \overline{x}\pm z_{\alpha /2}\frac{\sigma }{\sqrt{n}} = 105.36 \pm 1.96\times \frac{10}{\sqrt{25}},即 \large 105.36\pm 3.92 = \left ( 101.44,109.28 \right )

該批食品平均重量95%的置信區間爲:\large \left ( 101.44,109.28 \right ) 克之間。

解答完畢。


第 2 題

沿用上題中的數據,以95%的置信水平建立食品總體重量標準差的置信區間。

解答:

根據樣本數據計算的樣本方差爲:

\large s^{2} = \frac{\sum_{i=1}^{n}\left ( x_{i}-\overline{x} \right )^{2}}{n-1} = \frac{2237.02}{25-1} = 93.21

根據顯著性水平 \large \alpha =0.05 和自由度 \large n-1 = 25-1 = 24,查 \large \chi ^{^{2}} 分佈表得:

\large \chi _{\alpha /2}^{2}\left ( n-1 \right ) = \chi _{\0.025}^{2}\left ( 25-1 \right ) =39.3641

\large \chi _{1-\alpha /2}^{2}\left ( n-1 \right ) = \chi _{\0.975}^{2}\left ( 25-1 \right ) =12.4011

所以,總體方差\large \sigma ^{2}的置信區間爲:

\large \frac{\left ( 25-1 \right )\times 93.21}{39.3641}\leqslant \sigma ^{2}\leq \frac{\left ( 25-1 \right )\times 93.21}{12.4011}

解答完畢。

總體方差的區間估計

根據樣本方差的抽樣分佈可知,樣本方差服從自由度爲 \large n-1 的 \large \chi ^{2} 分佈。因此,用 \large \chi ^{2} 分佈構造總體方差的置信區間。若給定一個顯著水平 \large \alpha ,用 \large \chi ^{2} 分佈構造的總體方差 \large \sigma ^{2} 的置信區間可以用下圖表示:

從上圖中可以看出,建立總體方差 \large \sigma ^{2} 的置信區間,也就要找到一個 \large \chi ^{2} 值,使其滿足:

\large \chi _{1-\alpha /2}^{2} \leq \chi ^{2} \leq \chi _{\alpha /2}^{2}

由於 \large \frac{\left ( n-1 \right )s^{2}}{\sigma ^{2}} ~ \large \chi ^{2}\left ( n-1 \right ),可以用它來代替 \large \chi ^{2},於是有

\large \chi _{1-\alpha /2}^{2} \leq \ \frac{\left ( n-1 \right )s^{2}}{\sigma ^{2}}\leq \chi _{\alpha /2}^{2}

由此可以推導出總體方差 \large \sigma ^{2} 在 \large 1-\alpha 置信水平下的置信區間爲:

\large \frac{\left ( n-1 \right )s^{2}}{\chi _{\alpha /2}^{2}} \leq \sigma ^{2} \leq \frac{\left ( n-1 \right )s^{2}}{\chi _{1-\alpha /2}^{2}}


第 3 題

某城市想要估計下崗職工中女性所佔的比例,隨機抽取了100個下崗職工,其中65人爲女職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區間。

解答:

根據題意,已知 \large n=100\large z_{\alpha /2} = 1.96。根據抽樣結果計算的樣本比例爲:

\large p=\frac{65}{100}=0.65

總體比例的置信區間爲:\large p\pm z_{\alpha /2}\sqrt{\frac{p\left ( 1-p \right )}{n}} = 0.65 \pm 1.96\times \sqrt{\frac{0.65\times \left ( 1-0.65 \right )}{100}}

解答完畢。


第 4 題

擁有工商管理學士學位的大學畢業生年薪的標準差大約爲2000元,假定要估計年薪的95%的置信區間,希望估計誤差爲400元,應抽取多少樣本?

解答:由題意已知:標準差 \sigma = 2000E=400,95%的置信區間時 z_{\alpha /2} = 1.96

則樣本容量爲:n = \frac{\left ( z_{\alpha /2} \right )^{2} \sigma ^{2}}{E^{2}} = \frac{1.96^{2}\times 2000^{2}}{400^{2}} = 96.04\approx 97

即應抽取97人作爲樣本。

解答完畢。


第 5 題

根據以往的生產統計,某種產品的合格率約爲90%,現要求估計誤差爲5%,在95%的置信區間下,應抽到多少個產品作爲樣本?

解答:由題意已知:\pi =0.95,即 95%,E=0.05,即 5%,z_{\alpha /2} = 1.96

樣本容量 n = \frac{\left ( z_{\alpha /2} \right )^{2}\times \pi \times \left ( 1-\pi \right )}{E^{2}} = \frac{1.96^{2}\times 0.9\times \left ( 1-0.9 \right )}{0.05^{2}} = 138.3 \approx 139

即應抽取 139 個產品作爲樣本。

解答完畢。


思考題

1. 解釋估計量和估計值。
估計量:用於估計總體參數的隨機變量。
估計值:估計參數時計算出來的統計量的具體值。


2. 簡述評價估計量好壞的標準。
無偏性:估計量抽驗分佈的數學期望等於被估計的總體參數。
有效性:對同一總體參數的連個無偏點估計量,有更小標準差的估計量更有效。
一致性:隨着樣本容量的增大,估計量的值越來越接近被估計的總體參數。


3. 怎樣理解置信區間?
由樣本統計量所構造的總體參數的估計區間。

4. 解釋95%的置信區間。
用某種方法構造的所有區間中有95%的區間包含總體參數的真值。


5. z_{\alpha /2}\frac{\sigma }{\sqrt{n}} 的含義是什麼?

z_{\alpha /2} 是標準正態分佈上側面積爲\alpha /2 的𝑧值,公式是統計總體均值時的邊際誤差。


6. 解釋獨立樣本和匹配樣本的含義。
獨立樣本:兩個樣本是從兩個總體總獨立抽取的。
匹配樣本:一個樣本中的數據與另一個樣本中的數據相對應。


7. 在對兩個總體均值之差的小樣本估計中,對兩個總體和樣本都有哪些假定?

兩個總體都服從正態分佈;兩個隨機樣本獨立地分別抽自兩個總體。

8. 簡述樣本量與置信水平、總體方差、估計誤差的關係。

樣本量與置信水平成正比,與總體方差成正比,與估計誤差的平方成反比。


 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章