數據迴歸方法（二）—— 多元迴歸

原創

2020-06-01 16:37

實例引入：假如我們現在要去預測本地房子的價格，那麼我們該怎麼辦？影響房價的因素有很多：房子面積、方位、地理位置、本地居民收入、房齡等等，很自然的辦法就是將這些主要因素納入，建立一個多元數學模型，從而進行預測。

多元線性迴歸模型：

Y——我們要得到的結果，隨機變量，稱因變量； —— p個非隨機變量，是自變量。是未知參數，稱迴歸係數；ε 是均值爲0，方差爲的隨機變量，代表隨機因素對Y的影響。

總體的n組觀測值滿足下式：

其中，，才能求出所有迴歸係數；誤差係數相互獨立。

上述線性方程組可以寫成矩陣形式：

記

建立多元線性迴歸模型的基本步驟如下：

①分析問題，選擇因變量和自變量，作出二者的散點圖，初步設定多元線性迴歸模型的參數個數。

②輸入因變量與自變量的觀測值，計算參數估計。

③分析數據的異常點情況。

④作顯著性檢驗，若通過，則對模型作預測。

⑤對模型進一步研究，如殘差的正態性檢驗、殘差的異方差檢驗、殘差的自相關性檢驗等。

一般地，多元二項式迴歸模型可表示爲：

其步驟與多元線性迴歸類似，但在作散點圖時，一般是可以看到單個變量與隨機因變量之間無明顯線性關係。

迴歸方法可以利用MATLAB的Rstool(x,y,’model’,alpha)來進行。

如需技術探討或業務合作，可添加本人微信號：tuxinbang。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.