7.3 多元線性迴歸算法

原創

2020-02-25 23:58

與簡單線性迴歸區別(simple linear regression)
多個自變量(x)
多元迴歸模型
y=β0＋β１x1+β2x2+ … +βpxp+ε
其中：β0，β１，β2… βp是參數
ε是誤差值
多元迴歸方程
E(y)=β0＋β１x1+β2x2+ … +βpxp
估計多元迴歸方程:
y_hat=b0＋b１x1+b2x2+ … +bpxp

一個樣本被用來計算β0，β１，β2… βp的點估計b0, b1, b2,…, bp
估計流程 (與簡單線性迴歸類似）

6. 估計方法
使sum of squares最小

運算與簡單線性迴歸類似，涉及到線性代數和矩陣代數的運算

例子

一家快遞公司送貨：X1：運輸里程 X2：運輸次數 Y：總運輸時間

Time = b0+ b1*Miles + b2 * Deliveries

Time = -0.869 + 0.0611 Miles + 0.923 Deliveries

描述參數含義
b0: 平均每多運送一英里，運輸時間延長0.0611 小時
b1: 平均每多一次運輸，運輸時間延長 0.923 小時
預測

如果一個運輸任務是跑102英里，運輸6次，預計多少小時？

Time = -0.869 +0.0611 102+ 0.923 6
= 10.9 (小時）
如果自變量中有分類型變量(categorical data) , 如何處理？

英里數次數車型時間
100 4 1 9.3
50 3 0 4.8
100 4 1 8.9
100 2 2 6.5
50 2 2 4.2
80 2 1 6.2
75 3 1 7.4
65 4 0 6
90 3 0 7.6

關於誤差的分佈

誤差ε是一個隨機變量，均值爲0
ε的方差對於所有的自變量來說相等
所有ε的值是獨立的
ε滿足正態分佈，並且通過β0＋β１x1+β2x2+ … +βpxp反映y的期望值

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

4.1 最近鄰規則分類算法（KNN）

綜述 1.1 Cover和Hart在1968年提出了最初的鄰近算法 1.2 分類(classification)算法 1.3 輸入基於實例的學習(instance-based learning), 懶惰學習(lazy

2020-06-21 07:09:23

6.2 支持向量機應用（上）

1 sklearn簡單例子 # -*- coding:utf-8 -*- from sklearn import svm X=[[2,0],[1,1],[2,3]] y=[0,0,1] clf=svm.SVC(kernel='l

2020-06-21 06:22:32

7.2 簡單線性迴歸應用

簡單線性迴歸模型舉例：汽車賣家做電視廣告數量與賣出的汽車數量： 1.1 如何練處適合簡單線性迴歸模型的最佳迴歸線？使sum of squares最小 1.1.2 計算分子 = (1-2)(14-20)+(

2020-06-21 06:22:32

3.1、決策樹算法

什麼是決策樹/判定樹（decision tree)? 判定樹是一個類似於流程圖的樹結構：其中，每個內部結點表示在一個屬性上的測試，每個分支代表一個屬性輸出，而每個樹葉結點代表類或類分佈。樹的最頂層是根結點。機器學習中分類

2020-06-21 06:22:32

6.1 支持向量機算法（上）

2020-02-25 23:58:45

3.2 決策樹算法應用

2020-02-25 23:58:45

7.1 簡單線性迴歸算法

2020-02-25 23:58:45

5.1 神經網絡算法

2020-02-25 23:58:45

二、基本概念

2020-02-25 23:58:45

5.2 神經網絡算法應用

2020-02-25 23:58:45

一、機器學習介紹

2020-02-25 23:58:45

4.2 最近鄰規則分類算法（KNN)應用

2020-02-25 23:58:45

6.3 支持向量機算法(下）

2020-02-25 23:58:45

6.4 支持向量機應用（下）

2020-02-25 23:58:45

4.1 最近鄰規則分類算法（KNN）

綜述 1.1 Cover和Hart在1968年提出了最初的鄰近算法 1.2 分類(classification)算法 1.3 輸入基於實例的學習(instance-based learning), 懶惰學習(lazy

2020-06-21 07:09:23

24小時熱門文章

最新文章

最新評論文章