目錄
1 描述性統計
1.1 描述集中趨勢
變異係數是無單位指標(無量綱量)
移動平均其實就可以用來反應整體趨勢
1.2 描述離散趨勢
1.3 分佈
總體方差和總體標準差
樣本方差和樣本標準差
1 爲什麼樣本方差的分母是 n-1
Note:說明用分母爲n的總體方差公式計算的樣本方差會低估數據總體的波 動程度
概率分佈:每種分佈的場景和意義
2 推斷性統計
理論基礎是大數定律,大量抽樣樣本的分佈符合正態分佈。
2.1 參數估計
抽樣分佈
均值估計
方差估計
z分佈和t分佈是講均值的分佈的,卡方或者F分佈是說方差的分佈的。
怎樣用樣本參數 推斷 總體參數
2.2 假設檢驗
描述不同的區間多大程度上是可信的
4 相關分析:
4.1 迴歸分析
迴歸模型就是因變量和自變量的關係是直線的。
一元就是一個自變量,多元就是多個。一元迴歸模型是直線,多元就是超平面
Note: 非線性迴歸就是因變量和自變量關係不是直線,可以是邏輯迴歸那種曲線也可以是多項式那種曲線。
怎樣選擇 迴歸模型? 線性迴歸,多項式迴歸,邏輯迴歸
4.1.1 一元線性迴歸
a,b參數估計方法即模型的確認方法,其主要包括兩種方法:最小二乘法,極大似然法
4.2 時間序列分析
5 其他
計學習方法包括模型的假設空間、模型選擇的準則及模型選擇的算法,稱爲統計學習方法的三要素,簡稱模型(model)、策略(strategy)和算法(algorithm)
5.2 協方差
協方差表示的兩個隨機變量之間的相關性關係的,還有一個類似的是相關係數。
可以通俗的理解爲:兩個變量在變化過程中是同方向變化?還是反方向變化?同向或反向程度如
何?
你變大,同時我也變大,說明兩個變量是同向變化的,這時協方差就是正的。
你變大,同時我變小,說明兩個變量是反向變化的,這時協方差就是負的。
從數值來看,協方差的數值越大,兩個變量同向程度也就越大。反之亦然。
9 參考資料
[人人都會數據分析]