Ridge Regression 嶺迴歸

原創

2018-08-27 18:53

# coding:utf-8
import sklearn.datasets
import sklearn.linear_model
import numpy.random
import numpy.linalg
import matplotlib.pyplot

if __name__ == "__main__":
    # Load boston dataset
    boston = sklearn.datasets.load_boston()

    # Split the dataset with sampleRatio
    sampleRatio = 0.5
    n_samples = len(boston.target)
    sampleBoundary = int(n_samples * sampleRatio)

    # Shuffle the whole data
    shuffleIdx = range(n_samples)
    numpy.random.shuffle(shuffleIdx)

    # Make the training data
    train_features = boston.data[shuffleIdx[:sampleBoundary]]
    train_targets = boston.target[shuffleIdx[:sampleBoundary]]

    # Make the testing data
    test_features = boston.data[shuffleIdx[sampleBoundary:]]
    test_targets = boston.target[shuffleIdx[sampleBoundary:]]

    # Train with Cross Validation
    ridgeRegression = sklearn.linear_model.RidgeCV(alphas=[0.01, 0.05, 0.1, 0.5, 1.0, 10.0])
    # 這個地方使用RidgeCV 直接交叉驗證出我需要試驗的幾個懲罰因子，它會幫我選擇這些裏面在集內測試表現最優的一個參數。後面的輸出選擇了0.1.

    ridgeRegression.fit(train_features, train_targets)
    print("Alpha = ", ridgeRegression.alpha_)

    # Predict
    predict_targets = ridgeRegression.predict(test_features)

    # Evaluation
    n_test_samples = len(test_targets)
    X = range(n_test_samples)
    error = numpy.linalg.norm(predict_targets - test_targets, ord = 1) / n_test_samples
    print("Ridge Regression (Boston) Error: %.2f" %(error))

    # Draw
    matplotlib.pyplot.plot(X, predict_targets, 'r--', label = 'Predict Price')
    matplotlib.pyplot.plot(X, test_targets, 'g:', label = 'True Price')
    legend = matplotlib.pyplot.legend()
    matplotlib.pyplot.title("Ridge Regression (Boston)")
    matplotlib.pyplot.ylabel("Price (1000 U.S.D)")
    matplotlib.pyplot.savefig("Ridge Regression (Boston).png", format= 'png')
    matplotlib.pyplot.show()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

ImportError: cannot import name ‘__check_build‘ from partially initialized module ‘sklearn‘

同事的本子上用pip install scikit-learn 安裝時報錯說: sklearn\\datasets\\tests\\data\\openml\\1119\\api-v1-json-data-list-data_name

2020-07-04 10:50:57

python：scikit-learn（1），基本概念

《scikit-learn機器學習第2版》第1章機器學習基礎機器學習：通過經驗學習知道未來決策機器學習分爲監督學習和無監督學習監督學習：分類類別已知機器學習的輸入稱爲解釋變量，輸出稱爲響應變量組成監督學習經驗的實例

2020-07-01 23:46:45

scikit-learn工具包中常用的特徵選擇方法介紹

對於特徵選擇的作用在這裏照搬《西瓜書》中的描述：常用的特徵選擇方法有以下三種（備註：以下代碼採用Jupyter notebook編寫，格式與傳統稍有不同）： 1、過濾式特徵選擇簡單理解就是過濾式特徵選擇通過選擇與響應變量（目標變

2020-07-02 02:32:34

【scikit-learn】Python分類實例

引入一個機器可以根據照片來辨別鮮花的品種嗎？在機器學習角度，這其實是一個分類問題，即機器根據不同品種鮮花的數據進行學習，使其可以對未標記的測試圖片數據進行分類。這一小節，我們還是從scikit-learn出發，理解基本的分類原則，多動

Knowlege_上下求索

2020-07-01 21:50:10

【用戶指南|監督學習】1.10-決策樹

文章目錄1.10.1 分類1.10.2 迴歸1.10.3 多分類問題1.10.4 複雜度1.10.5 實際使用技巧1.10.6 決策樹算法：ID3 、C4.5、C5.0 和 CART1.10.7 數學表達式1.10.8 最小化成本

2020-06-29 11:53:28

python基礎 - Scikit-learn

Scikit-learn 是開源的 Python 庫，通過統一的界面實現機器學習、預處理、交叉驗證及可視化算法。一、加載數據 import numpy as np X = np.random.random((10, 5)) y = n

2020-06-27 12:42:05

Python: scikit-learn教程與實例（一）——數據預處理（數據標準化之線性變換）

scikit-learn數據預處理——數據標準化之線性變換 sklearn.preprocessing包提供了幾個常用的函數和類，用於常見的數據預處理操作。在講標準化之前需要強調的一點是scikit-learn對於數據集的要求是

2020-06-27 01:40:20

Python: scikit-learn教程與實例（一）——scikit-learn介紹與安裝

這裏寫自定義目錄標題scikit-learn介紹與安裝scikit-learn介紹scikit-learn安裝 scikit-learn介紹與安裝 scikit-learn介紹 Scikit-learn是一個基於Python開源的

2020-06-27 01:40:20

監督學習：簡單線性迴歸

監督學習：簡單線性迴歸爲散點數據集(x,y)擬合一條曲線 import matplotlib.pyplot as plt import seaborn as sns sns.set(); import numpy as np r

2020-06-27 00:34:21

【scikit-learn】網格搜索來進行高效的參數調優

內容概要¶ 如何使用K折交叉驗證來搜索最優調節參數如何讓搜索參數的流程更加高效如何一次性的搜索多個調節參數在進行真正的預測之前，如何對調節參數進行處理如何削減該過程的計算代價 1. K折交叉驗證回顧¶ 交叉驗證的過程選擇K的

2020-06-25 18:19:19

K-Means聚類算法【sklearn.cluster】

class sklearn.cluster.KMeans(n_clusters=8, *, init='kmeans++', n_init=10, max_iter=300, tol=0.0001, precompute_distanc

2020-06-23 04:05:09

scikit-learn：降維算法PCA和SVD

class sklearn.decomposition.PCA ( n_components=None, copy=True, whiten=False, svd_solve

2020-06-21 22:59:13

機器學習實戰之樸素貝葉斯--python/scikit-learn實現

目錄理論基礎知識基本思想貝葉斯模型手動計算實例一：實戰項目--屏蔽社區留言板的侮辱性言論 Python版本 Scikit-learn版本 One more thing 1.連續特徵的處理方式 2.零概率問題--拉普拉斯平滑

风后奇门‘

2020-06-20 21:38:46

機器學習實戰之K近鄰（KNN）-python/sklearn實現

目錄簡單理論介紹 kNN算法之約會網站配對（Python） scikit-learn實現簡單理論介紹 K最近鄰（k-Nearest Neighbor，KNN）分類算法應該是最簡單的機器學習算法了。它採用測量不同特徵值之間的距離方法進行

风后奇门‘

2020-06-20 21:38:46

An introduction to machine learning with scikit-learn

scikit-learn 是一個基於SciPy和Numpy的開源機器學習模塊，包括分類、迴歸、聚類的一系列算法，而且有詳細的文檔，是邊學邊練的絕佳教材，本文將通過一個簡單的例子向大家展示如何使用scikit-learn。這個例子是關於手寫

2020-06-19 19:37:17

24小時熱門文章

最新文章

最新評論文章