數據迴歸方法(二)—— 多元迴歸

1.多元線性迴歸

實例引入:假如我們現在要去預測本地房子的價格,那麼我們該怎麼辦?影響房價的因素有很多:房子面積、方位、地理位置、本地居民收入、房齡等等,很自然的辦法就是將這些主要因素納入,建立一個多元數學模型,從而進行預測。

多元線性迴歸模型:

Y——我們要得到的結果,隨機變量,稱因變量; —— p個非隨機變量,是自變量。 是未知參數,稱迴歸係數;ε 是均值爲0,方差爲 的隨機變量,代表隨機因素對Y的影響。

總體 的n組觀測值 滿足下式:

其中, ,才能求出所有迴歸係數;誤差係數 相互獨立。

上述線性方程組可以寫成矩陣形式:

建立多元線性迴歸模型的基本步驟如下:

①分析問題,選擇因變量和自變量,作出二者的散點圖,初步設定多元線性迴歸模型的參數個數。

②輸入因變量與自變量的觀測值,計算參數估計。

③分析數據的異常點情況。

④作顯著性檢驗,若通過,則對模型作預測。

⑤對模型進一步研究,如殘差的正態性檢驗、殘差的異方差檢驗、殘差的自相關性檢驗等。

2.多元多項式迴歸

一般地,多元二項式迴歸模型可表示爲:

其步驟與多元線性迴歸類似,但在作散點圖時,一般是可以看到單個變量與隨機因變量之間無明顯線性關係。

迴歸方法可以利用MATLAB的Rstool(x,y,’model’,alpha)來進行。

 

如需技術探討或業務合作,可添加本人微信號:tuxinbang。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章