在統計學中,一個概率樣本的置信區間(Confidence interval)是對這個樣本的某個總體參數的區間估計。置信區間展現的是這個參數的真實值有一定概率落在測量結果的周圍的程度。置信區間給出的是被測量參數的測量值的可信程度,即前面所要求的“一定概率”。這個概率被稱爲置信度(置信水平)。
問題:
一批零件長度服從\(N(\mu,\sigma^2)\)的正態分佈,\(\mu,\sigma^2\)均爲未知,現在隨機抽取16個零件,\(\bar x=20(cm),S=1(cm)\),則\(\mu\)的置信度爲0.90的置信區間爲_________.
統計量:
爲了某種目的人爲製造的隨機變量的函數.
常用統計量:
1、樣本均值:\(\bar X={1\over n} \sum^n_{i=1}X_i\).
2、樣本方差:\(S^2={1\over n-1}\sum^n_{i=1}(X_i-\bar X)^2 \).
統計量的分佈——四大分佈:
1、正態分佈:
\(X\sim N(\mu,\sigma^2)\), 期望:\(EX=\mu\), 方差:\(DX=\sigma^2\), 標準化:\({X-\mu\over{\sigma^2}}\sim N(0,1)\).
2、\(\chi^2\)分佈:
若\(X_1,X_2,...X_n\sim N(0,1)\),則
$$X=\sum^n_{i=1}X^2_i\sim \chi^2(n),自由度爲n$$ $$EX=n,DX=2n$$
3、t分佈(學生分佈):
若\(X\sim N(0,1)\),若\(Y\sim \chi^2(n)\),且\(X,Y\)相互獨立:
$$t={X\over\sqrt{Y\over n}}\sim t(n),自由度爲n.$$
4、F分佈:
若\(X\sim \chi^2(n_1)\),若\(Y\sim \chi^2(n_2)\),且\(X,Y\)相互獨立:
$$F={{X/n_1}\over{Y/n_2}}\sim F(n_1,n_2)自由度n_1,n_2.$$
上\(\alpha\)分位數:
\(P(U\geq u_\alpha)=\alpha\),\(u_\alpha \)爲上\(\alpha\)分位數.
通過查表可得到\(\alpha\)(概率密度函數的面積)對應的\(u_\alpha \)(分位值)的值.
置信度(置信水平)、置信區間:
\(P(|\bar X-\mu|<\delta)=1-\alpha, 1-\alpha\)爲置信度, \(\alpha\)爲顯著性水平,人爲選取.
大樣本情況下, 由中心極限定理可知:
不論\(X_i\mathrel{\mathop{\sim}\limits^{iid}}F(\mu,\sigma^2)(任意分佈)\),有$$\sum^n_{i=1}X_i{\mathrel{\mathop{\sim}\limits^{n\to\infty}}}{N(n\mu,n\sigma^2)}$$
\(\bar X\)與\(S^2\)相互獨立, 且\(E\bar X=\mu,D\bar X={1\over n}\sigma^2,ES^2=\sigma^2\).
下面就可以根據樣本統計量得到關於被估計參數測量值的分佈情況:
$$S^2={1\over {n-1}}\sum^n_{i=1}(X_i-\bar X)^2$$
$${(n-1)S^2\over \sigma^2}=\sum^n_{i=1}\left(X_i-\bar X\over{\sigma}\right)^2\sim\chi^2(n-1)$$
$${{\bar X-\mu}\over{S/\sqrt n}}={{{\bar X-\mu}\over{\sigma/n}}\over{S/\sigma}}={{{\bar X-\mu}\over{\sigma/\sqrt n}}\over{\sqrt{{{\left(n-1\right)S^2}/{\sigma^2}}\over{n-1}}}}\sim t(n-1).$$
到此, 得到了t分佈, t分佈爲已知分佈, 置信區間自然唾手可得:
$$P\left(\left|{{\bar X-\mu}\over{S/\sqrt n}}\right|<{\delta\over{S/\sqrt n}}\right)=1-\alpha$$
$$P(|t|<t_{\alpha\over 2}(n-1))=1-\alpha$$
$$\delta=t_{\alpha\over 2}(n-1)S/\sqrt n$$
樣本均值\(\bar X=\mu\)的概率爲0, 但\(\mu\)落在會以置信度\(1-\alpha\)爲概率落在置信區間\((\bar X-\delta,\bar X+\delta)\)上.
特殊情況:
\(\sigma^2\)已知(理想化條件, 一般爲未知)則:
$${{\bar X-\mu}\over{\sigma/\sqrt n}}\sim N(0,1)$$
此時, 置信區間可根據正太分佈計算.