抽樣與抽樣分佈:
•爲什麼要抽樣?
–總體中元素較多時,對所有元素進行逐一觀測往往很不現實,費時費力不及時
–要想知道梨子的味道就要親口嘗一嘗
–你不必喫完整一頭牛,才知道它的肉是咬不動的
–某種抽樣有破壞性,如炮彈、燈管等
•樣本和總體
•重置抽樣和不重置抽樣
•概率抽樣和非概率抽樣
•簡單隨機抽樣(simple random sampling)
–從總體N個單位中隨機地抽取n個單位作爲樣本,使得每一個單位都有相同的機會(概率)被抽中
–優點:
•簡單、直觀,抽樣框完整時,可直接從中抽取樣本
•用樣本統計量對目標量進行估計比較方便
–缺點:
•N很大時,不易構造抽樣框
•抽出的單位很分散,給實施調查增加了困難
•分層隨機抽樣(Stratified sampling )
–將抽樣單位按某種特徵或某種規則劃分爲不同的層,然後從不同的層中獨立、隨機地抽取樣本。
•整羣抽樣(Cluster sampling)
–將總體中若干個單位合併爲組(羣),抽樣時直接抽取羣,然後對中選羣中的所有單位全部實施調查。
•系統抽樣(Systematic sampling )
–將總體中的所有單位(抽樣單位)按一定順序排列,在規定的範圍內隨機地抽取一個單位作爲初始單位,然後按事先規定好的規則確定其他樣本單位。
常見的概率分佈:
正態分佈:
•在隨機理論中,正態分佈是最重要的一種分佈,理由如下:
•⑴它是最常見的一種分佈,現實中許多隨機變量都服從或近似服從正態分佈。
•⑵在一定的條件下,正態分佈是其他分佈的近似分佈。
•⑶許多有用的分佈,特別是小樣本的精確分佈是由正態分佈推導出來的。
X2分佈:
t分佈:
F分佈:
1.樣本統計量的概率分佈,是一種理論分佈
–在重複選取容量爲n的樣本時,由該統計量的所有可能取值形成的相對頻數分佈
2.樣本統計量是隨機變量
–樣本均值, 樣本比例,樣本方差等
3.結果來自容量相同的所有可能樣本
4.提供了樣本統計量長遠而穩定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據
樣本均值的抽樣分佈:
中心極限定理: