統計學期末總複習
題型:10選擇7大題
重點,三大抽樣分佈(第六章往後)
第一章
統計學(一) 導論之理論學習
這章沒有什麼重要的部分,只需要分清四個概念即可
- 總體
- 參數
- 樣本
- 統計量
話不多說直接放題目
答案: BADC
記住兩個對應關係這章就沒問題了:
總體->參數 樣本->統計量
第二章 不考
第三章
要求:會讀懂圖上的信息
下面放幾個重要或者可能忘記的圖
- 帕累託圖: 排好序的條形圖
- 累計頻數分佈圖: 向上累積和向下累積,很好理解
- 直方圖: 用面積代表頻率
- 莖葉圖: 瞭解如何讀數據
- 箱線圖: 中位數(記住中間是中位數不是平均值)
- 氣泡圖: 三維數據: 氣泡的大小代表第三維的數據
較大可能會考的小題: 求直方圖中的組中距
如果問170和180的組中值是多少.那麼顯然是175,
容易錯的考點是問140以下的組中值是多少? 135.
另外選擇題可以參考spoc上的練習題
第四章
要求:給數據會計算統計量 / 對同一類型爲什麼定義不同的統計量(均值會受異常值的影響,中位數則不會)
- 衆數(可以沒有,也可以不唯一)
- 中位數(最中間的數,如果有偶數個數則去平均)
- 中位數: Q1:n/4 ,Qu:3n/4
- 標準化: 標準分數
- 離散係數: 消除單位帶來的影響
較大可能會考的小題:四分位數的計算
爲了方便表示計算過程,這裏用到了python的列表
如:一組數 li = [1 2 3 4 5 6 7 8 9] 計算它的下四分位數
下四分位數的位置爲 n / 4 = len(li) / 4 = 2.25
所以下四分位數 = li[1] + 0.25 * li[2] - li[1] = 2 + 0.25 * (3 - 2 ) = 2.25
第五章
不會單獨出大題:需要記住下面的表,牢記期望和方差
- x~B(n,p)二項分佈
- x~p(λ) 泊松分佈
- x~u(a,b) 均勻分佈
- x~E(λ) 指數分佈
- x~N(μ,σ2) 正態分佈
第六章
要求:給一些隨機變量,會構造三大抽樣分佈
- 中心極限定理: 記一句話 n > 30 的時候 樣本的均值可以看成服從正態分佈
- 必須記住三大抽樣分佈(單總體的),如下圖
題目1: 判斷統計量和參數 (小題)
答: 1 2 個
解析: 第三個和第四個包含了參數,所以這兩個不是統計量
題目2 中心極限定理 (可能與後面的內容結合起來出大題)
題目3 三大抽樣分佈證明 (可能做爲第一道大題?證明題)
題目來自spoc
3.1
3.2
題目4 樣本均值 正態分佈(推論的一個應用,需理解,可能出大題)
調節一個裝瓶機使其對每個瓶子的灌裝量均值爲μ盎司,通過觀察這臺裝瓶機對每個瓶子的灌裝量服從標準差σ=1.0盎司的正態分佈。隨機抽取由這臺機器灌裝的9個瓶子形成一個樣本,並測定每個瓶子的灌裝量。試確定樣本均值偏離總體均值不超過0.3盎司的概率。
第七章
- 點估計
- 參數估計之點估計(矩估計,最大似然估計) 詳解+例題
- 矩估計
- 最大似然估計 ----->(一道大題)
- 區間估計(單總體) 大題一題
- 統計學 參數估計 之 總體均值的估計
- 統計學 參數估計 之 總體比例的估計
- 統計學 參數估計 之 總體方差的估計
題目1: 點估計 (大題必考題)
注意分清求的是估計值還是估計量(大寫)
1.1 已知分佈
1.2 未知分佈
這裏的最大似然估計似乎有些問題,不過方法類似
1.3 比較有效性(方差)
題目2 區間估計(大題必考)
2.1總體均值
還有小樣本,σ等情況自己練ppt的題目
2.2總體方差
2.3總體比例
在一項家電市場調查中,隨機抽取了200個居民戶,調查他們是否擁有某一品牌的電視機。其中擁有該品牌電視機的家庭佔23%。求總體比例的置信區間,置信水平分別爲90%和95%。
2.4樣本容量估計(可能和前面的結合起來考)
一位銀行管理人員想估計每位顧客在該銀行的月平均存款額,他假設所有顧客存款額的標準差爲1000元,要求估計誤差在200元以內,置信水平爲99%,則應選取多大的樣本?
第八章
必出大題
解題四步驟
- 寫清楚 H0,H1
- 寫統計量 + 服從什麼分佈
- 構造拒絕域
- 決策+結論
比第七章:參數估計多了一個原假設和備擇假設的過程,並且要判斷一下單側還是雙側檢驗,其他都近似一樣
注:拒絕域與備擇假設的符號一致,不等號代表兩側,等號都放在原假設
- 題目出現 根據經驗,廠家打出廣告 … 作爲原假設
- 不然就把要驗證的內容作爲備擇假設
注:一般要研究的內容 都是備擇假設
統計學 假設檢驗
統計學 假設檢驗 總體均值的檢驗
統計學 假設檢驗 P值
統計學 假設檢驗 總體比例與總體方差的檢驗
題目1 假設檢驗(大概率一道,單總體)
1.1總體均值
某機牀廠加工一種零件,根據經驗知道,該廠加工零件的橢圓度近似服從正態分佈,其總體均值爲0.081mm,總體標準差爲0.025 。今換一種新機牀進行加工,抽取n=200個零件進行檢驗,得到的橢圓度爲0.076mm。試問新機牀加工零件的橢圓度的均值與以前有無顯著差異?(a=0.05)
1.2總體比例
某種大量生產的袋裝食品,按規定不得少於250克。今從一批該食品中任意抽取50袋,發現有6袋低於250克。若規定不符合標準的比例超過5%就不得出廠,問該批食品能否出廠(a=0.05)?
1.3總體方差
第九章
卡方檢驗
- 擬合優度檢驗
- 列聯表的獨立性: 行和列是否相互獨立
- 3個相關係數
題目1: 擬合優度檢驗
題目2: 列聯表+三個係數
H0: 無關/獨立/ u1 = u2 = u3
H1: 有關/有聯繫/ u1 u2 u3 不完全相等
第十章
大題只考單因素方差,選擇題可能出一道雙因素
需要知道的概念
- SST 每個數據-總的均值 (total)
- SSA (每組的平均值-總的平均值)*每組的數據個數
- SSE 每個數據減組內平均值
- SST = SSA + SSE
- 均方
- MSA = SSA / n - 1
- MSE = SSE / n - k
表格要會畫
題目1單因素方差分析(很可能出填表的方式)
第十一章
只考一元線性迴歸
迴歸係數檢驗不要求掌握
- 最小二乘法結論
- SST
- SSR
- SSA
- 越大越好
重點要記住
題目
重點: 平均
必須掌握的填表,看錶
預測一下大題
點估計
區間估計
假設檢驗
分類數據分析(列聯表)
方差分析
一元線性迴歸