1. 數理統計---數理統計基本概念

1. 數理統計的基本概念

基本思想: 數據\Rightarrow歸納\Rightarrow結果
定義: 數理統計是以概率論爲基礎, 關於實驗數據的收集, 整理, 分析與推斷的一種科學與藝術.

1.1. 數據的收集:

總體: 研究對象的全體稱爲總體
個體: 總體中每一個具體的對象稱爲個體

**例子1**: 分析某工廠燈泡的壽命 總體--該班廠所有燈泡的壽命 個體--每一個燈泡的壽命
總體: 研究對象的數量指標X $X\sim F(x)$ 個體: 總體X的可能取值
燈泡壽命的例子: **總體**--該廠所有燈泡的壽命X $$X\sim N(\mu, \sigma^2)$$ **個體**--每一個燈泡的使用壽命, 即X的一個可能取值

我知道部分個體的值, 能否預測總體?
假設燈泡服從XN(μ,σ2),μσX\sim N(\mu, \sigma^2), 如何預測\mu和\sigma

定義1: 從總體XX中抽取的部分個體, 得到的數量指標X1,X2,...,XnX_1, X_2, ..., X_n, 若滿足下條件:
(1) X1,X2,...,XnX_1, X_2, ..., X_nXX同分布;
(2) X1,X2,...,XnX_1, X_2, ..., X_n相互獨立.
則稱X1,X2,...,XnX_1, X_2, ..., X_n是來自XX的一個簡單隨機樣本, 簡稱樣本

樣本觀測值: 對樣本X1,X2,...,XnX_1, X_2, ..., X_n進行觀測後, 得到的觀測值: x1,x2,...,xnx_1, x_2, ..., x_n稱爲樣本的觀測值.(注意: 小寫字母爲觀測值, 大寫字母爲樣本(隨機變量))

樣本的聯合分佈: 設總體XF(x)X\sim F(x), 則樣本X1,X2,...,XnX_1, X_2, ..., X_n的聯合分佈函數爲:
F(x1,...,xn)=P{X1x1,...,Xnxn}=i=1nF(xi) F(x_1, ..., x_n)=P\{X_1\leq x_1, ..., X_n\leq x_n\}=\prod_{i=1}^{n}F(x_i)
若總體XX的密度函數爲f(x)f(x), 則樣本X1,X2,...,XnX_1, X_2, ..., X_n的聯合密度函數爲(連續性):
f(x1,...,xn)=i=1nf(xi) f(x_1, ..., x_n)=\prod_{i=1}^n f(x_i)
若總體XX的分佈律爲(離散型):P{X=ak}=pk,k=1,2,...P\{X=a_k\}=p_k, k=1,2, ...
則樣本X1,X2,...,XnX_1, X_2, ..., X_n的聯合分佈律爲:
P{X1=x1,X2=x2,...,Xn=xn}=P{X1=x1}P{X2=x2}...P{Xn=xn}=i=1nP{X=xi} P\{X_1=x_1, X_2=x_2, ..., X_n=x_n\}=P\{X_1=x_1\}*P\{X_2=x_2\}...P\{X_n=x_n\}=\prod_{i=1}^n P\{X=x_i\}

例子2: 設$X_1, X_2, ..., X_n$是來自總體$N(\mu, \sigma^2)$的樣本, 則樣本的聯合密度函數爲: $$f(x_1, x_2, ..., x_n)=\prod_{i=1}^n f(x_i)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-u)^2}{2\sigma^2}}$$
例子3: 設$X_1, X_2, ..., X_n$是來自總體$B(1, p)$的樣本, 則樣本的聯合分佈函數爲: $$P\{X_1=x_1, ..., X_n=x_n\}=\prod_{i=1}^n P{X=x_i}=\prod_{i=1}^{n}p^{x_1}p^{(1-x_i)}=p^{(\sum_{i=1}^n{x_i})}p^{\sum_{i=1}^n{(1-x_i)}}$$
樣本與總體的關係:   總體  $\Downarrow$    $\Uparrow$ 樣本 $\Rightarrow$ 樣本值

1.2. 數據的整理:

統計量
定義2: 設X1,X2,...,XnX_1, X_2, ..., X_n是來自總體X F(x)X~F(x)的樣本, g(x1,x2,...,xn)g(x_1, x_2, ..., x_n)是n元實值連續函數, 若g(x1,x2,...,xn)g(x_1, x_2, ..., x_n)不含未知參數, 則稱g(x1,x2,...,xn)g(x_1, x_2, ..., x_n)統計量.

1.2.1 常見的統計量

X1,X2,...,XnX_1, X_2, ..., X_n是來自樣本X的樣本, 則稱:
(1)Xˉ=1ni=1nXi(2)S2=1n1i=1n(XiXˉ)2S=1n1i=1n(XiXˉ)2(3)KAk=1ni=1nXik(4)KBk=1ni=1n(XiXˉ)k(5),,Rn=X(n)X(1)\begin{aligned} (1)& 樣本均值\bar X=\frac{1}{n}\sum_{i=1}^nX_i\\ (2)& 樣本方差S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2\\ &樣本標準差S=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2}\\ (3)& 樣本K階原點矩 A_k=\frac{1}{n}\sum_{i=1}^nX_i^k\\ (4)& 樣本K階中心矩 B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\bar X)^k\\ (5)& 樣本極大值, 樣本極小值, 樣本極差 R_n=X_{(n)}-X_{(1)} \end{aligned}

1.2.2 樣本均值與樣本方差的數字特徵

命題1: 設X1,X2,...,XnX_1, X_2, ..., X_n是來自總體X F(x)X~F(x)的樣本, 且總體的均值與方差存在, 記爲:
E(X)=μ,D(X)=σ2 E(X)=\mu, D(X)=\sigma^2
則有:
(1)E(Xˉ)=μ,D(Xˉ)=1nσ2(2)E(S2)=σ2(1)E(\bar X)=\mu, D(\bar X)=\frac{1}{n}\sigma^2\\ (2) E(S^2)=\sigma^2
證明:
已知E(X)=μ,D(X)=σ2E(X)=\mu, D(X)=\sigma^2
(1)E(Xˉ)=E(1ni=1nXi)=1ni=1nE(Xi)=1nnμ=μD(Xˉ)=D(1ni=1nXi)=1n2i=1nD(Xi)()=1n2σ2\begin{aligned} (1) E(\bar X)&=E(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n}\sum_{i=1}^{n}E(X_i)\\ &=\frac{1}{n}*n\mu=\mu\\ D(\bar X)&=D(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n^2}\sum_{i=1}^{n}D(X_i)(此步用到獨立同分布)\\ &=\frac{1}{n^2}*\sigma^2 \end{aligned}

(2) 先推導一個公式
i=1n(XiXˉ)2=i=1nXi2nXˉ2=i=1n(Xi22XiXˉ+Xˉ2)=i=1nXi22i=1nXiXˉ+i=1nXˉ2=i=1nXi22Xˉi=1nXi+nXˉ2=i=1nXi2nXˉ2\begin{aligned} \sum_{i=1}^n(X_i-\bar X)^2&=\sum_{i=1}^n X_i^2-n\bar X^2\\ 左邊&=\sum_{i=1}^n(X_i^2-2X_i\bar X+\bar X^2)\\ &=\sum_{i=1}^n X_i^2-2\sum_{i=1}^n X_i\bar X+\sum_{i=1}^n \bar X^2\\ &=\sum_{i=1}^n X_i^2-2\bar X\sum_{i=1}^n X_i+n\bar X^2\\ &=\sum_{i=1}^n X_i^2-n\bar X^2 \end{aligned}
然後證明公式:
E[i=1n(XiXˉ)2]=E[i=1nXi2nXˉ2]=i=1nE(Xi2)nE(Xˉ2)=i=1n[D(Xi)+E(Xi)2]n[D(Xˉ)+E(Xˉ)2]=nσ2+nμ2n1nσ2nμ2=(n1)σ2(2)\begin{aligned} E[\sum_{i=1}^n(X_i-\bar X)^2]&=E[\sum_{i=1}^n X_i^2-n\bar X^2]\\ &=\sum_{i=1}^n E(X_i^2)-nE(\bar X^2)\\ &=\sum_{i=1}^n [D(X_i)+E(X_i)^2]-n[D(\bar X)+E(\bar X)^2]\\ &=n\sigma^2+n\mu^2-n*\frac{1}{n}\sigma^2-n*\mu^2\\ &=(n-1)\sigma^2 \end{aligned}\tag{2}
最後得到:
E(S2)=E(1n1n11(XiXˉ)2)=1n1E(n11(XiXˉ)2)=1n1(n1)σ2=σ2\begin{aligned} E(S^2)&=E(\frac{1}{n-1}\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}E(\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}*(n-1)\sigma^2\\ &=\sigma^2 \end{aligned}

上面的結果說明了什麼?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章