幾種常用迴歸算法——線性迴歸、支持向量機迴歸和KNN迴歸

原創

文龙问路

2020-06-26 17:11

歡迎關注，敬請點贊！

臺灣何時歸——幾種常用迴歸算法

線性迴歸LR(Linear Regression)

代碼展示(加噪聲的正旋函數，狹義線性迴歸)

支持向量機迴歸SVR(Support Vector Regression)

代碼展示(加噪聲的正旋函數，支持向量機迴歸)

KNN迴歸(KNeighborsRegressor)

代碼展示(加噪聲的正旋函數，KNN迴歸)

對比總結：

線性迴歸LR(Linear Regression)

傳統的多變量線性迴歸可以表示成下面的形式：——狹義的線性迴歸
$f(X, \theta) = X \theta = \theta_0 + x_1 \theta_1 + x_2 \theta_2 + …… + x_n \theta_n \tag{公式1}$
這個模型的自變量是一次的，能解決的問題有很大的侷限性，如果數據具有非線性的趨勢，便不能得到很好的表達。將自變量擴展到高次的情況，便得到了多項式迴歸(擬合)。
$f(X, \theta) = X \theta = \theta_0 + \theta_1 x + \theta_2 x^2 + …… + \theta_n x^n = \phi (X) \theta \tag{公式2}$
其中 $\phi(X) = [1, x, x^2, ……, x^n], \theta = [\theta_0, \theta_1, \theta_2, ……, \theta_n]^T$ ，將 $\phi (X)$ 稱爲基函數，這裏我們選用了多項式基函數。選用不同的基函數能解決更爲廣泛的問題。——廣義的線性迴歸

代碼展示(加噪聲的正旋函數，狹義線性迴歸)

from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
import numpy as np

X = np.linspace(0, 2 * np.pi, 50)
y = np.sin(X) + np.random.random(size=(50,))

lr = LinearRegression()
lr.fit(X.reshape(-1, 1), y)
y_pred_lr = lr.predict(X.reshape(-1, 1))

plt.scatter(X, y)
plt.plot(X, y_pred_lr)
plt.show()

支持向量機迴歸SVR(Support Vector Regression)

返回頂部
支持向量機裏面有核函數的概念，把數據映射到高維空間，隱式地應用了多項式，支持向量機迴歸能很好擬合非線性趨勢。

代碼展示(加噪聲的正旋函數，支持向量機迴歸)

from sklearn.svm import SVR
import matplotlib.pyplot as plt
import numpy as np

X = np.linspace(0, 2 * np.pi, 50)
y = np.sin(X) + np.random.random(size=(50,))

svr = SVR()
svr.fit(X.reshape(-1, 1), y)
y_pred_svr = svr.predict(X.reshape(-1, 1))

plt.scatter(X, y)
plt.plot(X, y_pred_svr)
plt.show()

KNN迴歸(KNeighborsRegressor)

返回頂部
非參數方法。

周圍數據的平均值，默認用minkowski距離來選擇最近的點。鄰居數(n-neighbors)越大，越平滑(bias)；越小，越過擬合(vias)

代碼展示(加噪聲的正旋函數，KNN迴歸)

from sklearn.neighbors import KNeighborsRegressor
import matplotlib.pyplot as plt
import numpy as np

X = np.linspace(0, 2 * np.pi, 50)
y = np.sin(X) + np.random.random(size=(50,))

knnr = KNeighborsRegressor()
knnr.fit(X.reshape(-1, 1), y)
y_pred_knnr = knnr.predict(X.reshape(-1, 1))

plt.scatter(X, y)
plt.plot(X, y_pred_knnr)
plt.show()

對比總結：

1. 狹義的線性迴歸不擬合非線性；
2. 支持向量機迴歸很好擬合非線性；
3. KNN可以擬合非線性(但不夠平滑)。

寫代碼不忘國事！
歡迎關注，敬請點贊！
返回頂部

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

幾種常用迴歸算法——線性迴歸、支持向量機迴歸和KNN迴歸

臺灣何時歸——幾種常用迴歸算法

線性迴歸LR(Linear Regression)

代碼展示(加噪聲的正旋函數，狹義線性迴歸)

支持向量機迴歸SVR(Support Vector Regression)

代碼展示(加噪聲的正旋函數，支持向量機迴歸)

KNN迴歸(KNeighborsRegressor)

代碼展示(加噪聲的正旋函數，KNN迴歸)

對比總結：

距離產生美——機器學習常用距離numpy計算

濃縮就是精華——21行python實現輸入法自動提示（帶過程舉例，附錄也精彩）

包打天下——Docker入門體驗

深度學習——相關公式及優化

生態化反——hadhoop生態圈

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結