統計學~迴歸分析【第九周】

文章目錄

一元線性迴歸

帶入上面溫度與銷量的數據，可解出：

即下面這條直線：

得到線性關係後，我們還可以對其他溫度下冰淇淋的銷量做預測。

擬合優度檢驗

擬合優度（Goodness of Fit）是指回歸直線對觀測值的擬合程度，是用來測量模型的迴歸程度好壞的。
擬合優度檢驗是假設檢驗的一種，用來檢測觀測數與根據模型計算得到的理論數之間的一種假設檢驗，以便於判斷該假設或模型是否與實際觀測數吻合。
具體步驟可參考：擬合優度檢驗

顯著性檢驗

我們知道，在假設檢驗中有兩類錯誤：

1.原假設實際爲真，但根據樣本數據判別爲拒絕，此類錯誤被稱爲“棄真”錯誤，即將真的當作假的。
2.原假設實際爲假，但根據樣本數據判別爲接受，此類錯誤被稱爲“取僞”錯誤，即將假的當作真的。

通常把第一類錯誤出現的概率記爲α，第二類錯誤出現的概率記爲β。通常只限定犯第一類錯誤的最大概率α，不考慮犯第二類錯誤的概率β。我們把這樣的假設檢驗稱爲顯著性檢驗，並且稱概率α稱爲顯著性水平。

迴歸預測

迴歸分析預測法，是在分析市場現象自變量和因變量之間相關關係的基礎上，建立變量之間的迴歸方程，並將迴歸方程作爲預測模型，根據自變量在預測期的數量變化來預測因變量，關係大多表現爲相關關係。

迴歸預測法的步驟：

1．根據預測目標，確定自變量和因變量
明確預測的具體目標，也就確定了因變量。如預測具體目標是下一年度的銷售量，那麼銷售量Y就是因變量。通過市場調查和查閱資料，尋找與預測目標的相關影響因素，即自變量，並從中選出主要的影響因素。

2．建立迴歸預測模型
　　依據自變量和因變量的歷史統計資料進行計算，在此基礎上建立迴歸分析方程，即迴歸分析預測模型。

3．進行相關分析
　　迴歸分析是對具有因果關係的影響因素（自變量）和預測對象（因變量）所進行的數理統計分析處理。只有當變量與因變量確實存在某種關係時，建立的迴歸方程纔有意義。因此，作爲自變量的因素與作爲因變量的預測對象是否有關，相關程度如何，以及判斷這種相關程度的把握性多大，就成爲進行迴歸分析必須要解決的問題。進行相關分析，一般要求出相關關係，以相關係數的大小來判斷自變量和因變量的相關的程度。

4．檢驗迴歸預測模型，計算預測誤差
　　迴歸預測模型是否可用於實際預測，取決於對迴歸預測模型的檢驗和對預測誤差的計算。迴歸方程只有通過各種檢驗，且預測誤差較小，才能將回歸方程作爲預測模型進行預測。

5．計算並確定預測值
　　利用迴歸預測模型計算預測值，並對預測值進行綜合分析，確定最後的預測值。

殘差分析

殘差是指觀測值與預測值（擬合值）之間的差，即是實際觀察值與迴歸估計值的差。
在迴歸分析中，測定值與按回歸方程預測的值之差，並且殘差服從正態分佈，通常可以根據分析殘差的分佈情況來校驗模型的合理性。參考殘差分析

多元線性迴歸

多重共線性

在多元線性迴歸模型經典假設中，其重要假定之一是迴歸模型的解釋變量之間不存在線性關係，也就是說，解釋變量X1，X2，……，Xk中的任何一個都不能是其他解釋變量的線性組合。如果違背這一假定，即線性迴歸模型中某一個解釋變量與其他解釋變量間存在線性關係，就稱線性迴歸模型中存在多重共線性。多重共線性違背瞭解釋變量間不相關的古典假設，將給普通最小二乘法帶來嚴重後果。

解決方法可參考多重共線性問題的幾種解決方法

變量選擇與逐步迴歸

在建立迴歸模型時，首要問題是如何確定迴歸自變量，若遺漏了重要的變量，迴歸方程的效果肯定不會太好，但是當變量過多時，某些變量可能會重疊，某些程度上會增大計算量，迴歸方程穩定性也差，直接影響到迴歸方程的使用。
逐步迴歸是變量選擇裏面的一種方法，基本步驟如圖：

參考

關於顯著性檢驗，你想要的都在這兒了！！（基礎篇）

總結

這一章的理論性比較強，後面需要參考例題進行應用。

統計學~迴歸分析【第九周】

文章目錄

一元線性迴歸

相關關係

相關關係的分類

最小二乘法

擬合優度檢驗

顯著性檢驗

迴歸預測

殘差分析

多元線性迴歸

多重共線性

變量選擇與逐步迴歸

參考

總結

移位操作搞定兩數之商

如何基於surging跨網關跨語言進行緩存降級

2024合集

程序員天天 CURD，怎麼才能成長，職業發展的思考(2)

教你用Perl實現Smgp協議

如何通過前端表格控件在10分鐘內完成一張分組報表？

win11關閉自動檢測病毒刪文件

通用代碼生成器簡介

lightdb 單機模式下數據庫平移

千兆寬帶實際網速能到達多少？

統計學~體溫是否符合正態分佈？【第四周】

機器學習~KNN算法

統計學~迴歸分析【第九周】

機器學習~KNN算法的更多思考

機器學習~K-Means

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結