學習筆記,僅供參考,有錯必糾
具體原理:參數估計
賈俊平統計學
參數估計
- 參數估計
參數估計:就是在抽樣及抽樣分佈的基礎上,用樣本統計量去估計總體的參數。參數估計是推斷統計的重要內容之一。
- 估計量與估計值
樣本的函數稱之爲統計量,而用於估計的統計量則被稱爲估計量。由於統計量對於不同的樣本取值不同,所以估計量就是隨機變量,並有其分佈。如果樣本已經得到,把數據帶入後,估計量就有了一個數值,也就不是隨機的了,這個數值就是該估計量的一個實現或取值,也稱爲一個估計值。
- 點估計與區間估計
點估計:用某個估計值作爲總體參數的估計。
區間估計:是在點估計的基礎上,給出總體參數估計的一個區間範圍,該區間通常由樣本統計量加減邊際誤差得到。
置信水平:也稱爲置信度或置信係數,它是將構造置信區間的步驟重複多次,置信區間中包含總體參數真值的次數所佔的比例。
置信區間:由樣本統計量所構造的總體參數的估計區間。
- 評價估計量的標準
估計量評價標準:無偏性、有效性、一致性
- 一個總體參數的區間估計
- 兩個總體參數估計
- 樣本容量的確定
式中的值是使用者在給定的置信水平下可以接受的估計誤差,的值可直接由區間估計中所用到的置信水平確定。
假設檢驗
- 假設檢驗
假設檢驗:統計推斷的重要內容之一,先對總體參數提出一個假設,然後利用樣本來檢驗該假設是否成立。
- 假設的表達式
統計的語言是用一個等式或不等式表示問題的原假設。我們用表示要檢驗的參數,用表示感興趣的數值,則原假設一般的表達式爲:
這裏的表示原假設,由於原假設的下標用0表示,所以有些文獻上將此稱爲"零假設"。
儘管原假設陳述的是兩個總體的均值相等,卻並不表示它是既定的事實.僅是假設而已。如果原假設不成立,就要拒絕原假設,而需要在另一個假設中做出選擇,這個假設稱爲備擇假設,備擇假設一般的表達式爲:
- 兩類錯誤
棄真錯誤(錯誤)與取僞錯誤(錯誤):前者是原假設爲真卻被拒絕所犯的錯誤,後者是原假設爲假卻沒被拒絕所犯的錯誤。樣本量一定時,兩者是此消彼長的關係,若增大樣本量則兩者同時時變小。假設檢驗中遵循"首先控制犯錯誤"的原則。
- P值
P值就是當原假設爲真時所得到的樣本觀察結果或更極端結果出現的概率,P值也稱爲實測到的顯著性水平。如果P值很小,說明這種情況發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,P值越小,我們拒絕原假設的理由就越充分。
- 檢驗統計量的確定
根據假設檢驗的不同內容和進行檢驗的不同條件。需要採用不同的檢驗統計量,在一個總體參數的檢驗中,用到的檢驗統計量主要有三個:統計量,統計量,卡方統計量。統計量和統計量常常用於均值和比例的檢驗,卡方統計量則用於方差的檢驗。
- 一個總體的檢驗
- 兩個總體的檢驗