7.1簡單線性迴歸--python機器學習

原創

qq_16365849

2020-02-26 05:46

0. 前提介紹：

爲什麼需要統計量？

統計量：描述數據特徵

0.1 集中趨勢衡量

0.1.1均值（平均數，平均值）（mean）

{6, 2, 9, 1, 2}

(6 + 2 + 9 + 1 + 2) / 5 = 20 / 5 = 4

0.1.2中位數（median）: 將數據中的各個數值按照大小順序排列，居於中間位置的變量

0.1.2.1. 給數據排序：1， 2， 2， 6， 9

0.1.2.2. 找出位置處於中間的變量：2

當n爲基數的時候：直接取位置處於中間的變量

當n爲偶數的時候，取中間兩個量的平均值

0.1.2衆數（mode）：數據中出現次數最多的數

0.2

0.2.1. 離散程度衡量

0.2.1.1方差（variance)

{6, 2, 9, 1, 2}

(1) (6 - 4)^2 + (2 - 4) ^2 + (9 - 4)^2 + (1 - 4)^2 + (2 - 4)^2

= 4 + 4 + 25 + 9 + 4

= 46

(2) n - 1 = 5 - 1 = 4

(3) 46 / 4 = 11.5

0.2.1.2標準差 (standard deviation)

s = sqrt(11.5) = 3.39

1. 介紹：迴歸(regression) Y變量爲連續數值型(continuous numerical variable)

如：房價，人數，降雨量

分類(Classification): Y變量爲類別型(categorical variable)

如：顏色類別，電腦品牌，有無信譽

2. 簡單線性迴歸(Simple Linear Regression)

2.1 很多做決定過過程通常是根據兩個或者多個變量之間的關係

2.3 迴歸分析(regression analysis)用來建立方程模擬兩個或者多個變量之間如何關聯

2.4 被預測的變量叫做：因變量(dependent variable), y, 輸出(output)

2.5 被用來進行預測的變量叫做：自變量(independent variable), x, 輸入(input)

3. 簡單線性迴歸介紹

3.1 簡單線性迴歸包含一個自變量(x)和一個因變量(y)

3.2 以上兩個變量的關係用一條直線來模擬

3.3 如果包含兩個以上的自變量，則稱作多元迴歸分析(multiple regression)

4. 簡單線性迴歸模型

4.1 被用來描述因變量(y)和自變量(X)以及偏差(error)之間關係的方程叫做迴歸模型

4.2 簡單線性迴歸的模型是:

其中：參數偏差

5. 簡單線性迴歸方程

E(y) = β₀+β₁x

這個方程對應的圖像是一條直線，稱作迴歸線

其中，β₀是迴歸線的截距

β₁是迴歸線的斜率

E(y)是在一個給定x值下y的期望值（均值）

6. 正向線性關係：

7. 負向線性關係：

8. 無關係

9. 估計的簡單線性迴歸方程

ŷ=b₀+b₁x

這個方程叫做估計線性方程(estimated regression line)

其中，b₀是估計線性方程的縱截距

b₁是估計線性方程的斜率

ŷ是在自變量x等於一個給定值的時候，y的估計值

10. 線性迴歸分析流程：

11. 關於偏差ε的假定

11.1 是一個隨機的變量，均值爲0

11.2 ε的方差(variance)對於所有的自變量x是一樣的

11.3 ε的值是獨立的

11.4 ε滿足正態分佈

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

7.1簡單線性迴歸--python機器學習

1.1機器學習基礎-python深度機器學習

6.1神經網絡--python機器學習

4.1K近鄰--python機器學習

5.1SVM--python機器學習

5.3SVM實例1--python機器學習

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結