1. 數理統計的基本概念
基本思想: 數據⇒歸納⇒結果
定義: 數理統計是以概率論爲基礎, 關於實驗數據的收集, 整理, 分析與推斷的一種科學與藝術.
1.1. 數據的收集:
總體: 研究對象的全體稱爲總體
個體: 總體中每一個具體的對象稱爲個體
**例子1**: 分析某工廠燈泡的壽命
總體--該班廠所有燈泡的壽命
個體--每一個燈泡的壽命
|
總體: 研究對象的數量指標X
$X\sim F(x)$
個體: 總體X的可能取值
燈泡壽命的例子:
**總體**--該廠所有燈泡的壽命X
$$X\sim N(\mu, \sigma^2)$$
**個體**--每一個燈泡的使用壽命, 即X的一個可能取值
|
我知道部分個體的值, 能否預測總體?
假設燈泡服從X∼N(μ,σ2),如何預測μ和σ
定義1: 從總體X中抽取的部分個體, 得到的數量指標X1,X2,...,Xn, 若滿足下條件:
(1) X1,X2,...,Xn與X同分布;
(2) X1,X2,...,Xn相互獨立.
則稱X1,X2,...,Xn是來自X的一個簡單隨機樣本, 簡稱樣本
樣本觀測值: 對樣本X1,X2,...,Xn進行觀測後, 得到的觀測值: x1,x2,...,xn稱爲樣本的觀測值.(注意: 小寫字母爲觀測值, 大寫字母爲樣本(隨機變量))
樣本的聯合分佈: 設總體X∼F(x), 則樣本X1,X2,...,Xn的聯合分佈函數爲:
F(x1,...,xn)=P{X1≤x1,...,Xn≤xn}=i=1∏nF(xi)
若總體X的密度函數爲f(x), 則樣本X1,X2,...,Xn的聯合密度函數爲(連續性):
f(x1,...,xn)=i=1∏nf(xi)
若總體X的分佈律爲(離散型):P{X=ak}=pk,k=1,2,...
則樣本X1,X2,...,Xn的聯合分佈律爲:
P{X1=x1,X2=x2,...,Xn=xn}=P{X1=x1}∗P{X2=x2}...P{Xn=xn}=i=1∏nP{X=xi}
例子2:
設$X_1, X_2, ..., X_n$是來自總體$N(\mu, \sigma^2)$的樣本, 則樣本的聯合密度函數爲:
$$f(x_1, x_2, ..., x_n)=\prod_{i=1}^n f(x_i)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-u)^2}{2\sigma^2}}$$ |
例子3:
設$X_1, X_2, ..., X_n$是來自總體$B(1, p)$的樣本, 則樣本的聯合分佈函數爲:
$$P\{X_1=x_1, ..., X_n=x_n\}=\prod_{i=1}^n P{X=x_i}=\prod_{i=1}^{n}p^{x_1}p^{(1-x_i)}=p^{(\sum_{i=1}^n{x_i})}p^{\sum_{i=1}^n{(1-x_i)}}$$ |
樣本與總體的關係:
總體
$\Downarrow$ $\Uparrow$
樣本 $\Rightarrow$ 樣本值 |
1.2. 數據的整理:
統計量
定義2: 設X1,X2,...,Xn是來自總體X F(x)的樣本, g(x1,x2,...,xn)是n元實值連續函數, 若g(x1,x2,...,xn)不含未知參數, 則稱g(x1,x2,...,xn)爲統計量.
1.2.1 常見的統計量
設X1,X2,...,Xn是來自樣本X的樣本, 則稱:
(1)(2)(3)(4)(5)樣本均值Xˉ=n1i=1∑nXi樣本方差S2=n−11i=1∑n(Xi−Xˉ)2樣本標準差S=n−11i=1∑n(Xi−Xˉ)2樣本K階原點矩Ak=n1i=1∑nXik樣本K階中心矩Bk=n1i=1∑n(Xi−Xˉ)k樣本極大值,樣本極小值,樣本極差Rn=X(n)−X(1)
1.2.2 樣本均值與樣本方差的數字特徵
命題1: 設X1,X2,...,Xn是來自總體X F(x)的樣本, 且總體的均值與方差存在, 記爲:
E(X)=μ,D(X)=σ2
則有:
(1)E(Xˉ)=μ,D(Xˉ)=n1σ2(2)E(S2)=σ2
證明:
已知E(X)=μ,D(X)=σ2
(1)E(Xˉ)D(Xˉ)=E(n1i=1∑nXi)=n1i=1∑nE(Xi)=n1∗nμ=μ=D(n1i=1∑nXi)=n21i=1∑nD(Xi)(此步用到獨立同分布)=n21∗σ2
(2) 先推導一個公式
i=1∑n(Xi−Xˉ)2左邊=i=1∑nXi2−nXˉ2=i=1∑n(Xi2−2XiXˉ+Xˉ2)=i=1∑nXi2−2i=1∑nXiXˉ+i=1∑nXˉ2=i=1∑nXi2−2Xˉi=1∑nXi+nXˉ2=i=1∑nXi2−nXˉ2
然後證明公式:
E[i=1∑n(Xi−Xˉ)2]=E[i=1∑nXi2−nXˉ2]=i=1∑nE(Xi2)−nE(Xˉ2)=i=1∑n[D(Xi)+E(Xi)2]−n[D(Xˉ)+E(Xˉ)2]=nσ2+nμ2−n∗n1σ2−n∗μ2=(n−1)σ2(2)
最後得到:
E(S2)=E(n−11n−1∑1(Xi−Xˉ)2)=n−11E(n−1∑1(Xi−Xˉ)2)=n−11∗(n−1)σ2=σ2
上面的結果說明了什麼?