鳶尾花——邏輯迴歸

原創

2019-05-01 00:51

現有鳶尾花數據集iris.csv。Iris數據集是常用的分類實驗數據集，由Fisher, 1936收集整理。Iris也稱鳶尾花卉數據集，是一類多重變量分析的數據集。數據集包含150個數據集，分爲3類，每類50個數據，每個數據包含4個屬性。可通過花萼長度，花萼寬度，花瓣

長度，花瓣寬度4個屬性預測鳶尾花卉屬於（Setosa，Versicolour，Virginica）三個種類中的哪一類。

具體要求：

使用邏輯迴歸模型訓練鳶尾花數據集，測試集取20%，訓練集取80%。
先對數據進行標準化後，分別採用多項式的次數爲1-9進行訓練，solver和multi_class請自行選擇。
分別在控制檯打印出多項式次數爲1-9時，該模型在測試集上預測出準確分類的正確率。

import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler, PolynomialFeatures
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.pipeline import make_pipeline
if __name__ == "__main__":
    path = 'D://Ml_Lab_Data/iris.csv'  # 數據文件路徑
    data = pd.read_csv(path, header=None)

    X, Y = np.split(data, (4,), axis=1)
    le = LabelEncoder()
    le.fit(Y)
    Y = le.transform(Y)

    X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=1)

    # 標準化特徵值
    sc = StandardScaler()
    sc.fit(X_train)
    X_train_std = sc.transform(X_train)
    X_test_std = sc.transform(X_test)

    for i in range(1, 10):

        model = make_pipeline(PolynomialFeatures(degree=i),
                               LogisticRegression(solver='sag', multi_class='multinomial', max_iter=10000))
        model.fit(X_train, Y_train)
        acc = model.score(X_test_std, Y_test)
        print((i,acc * 100))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

鳶尾花——邏輯迴歸

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

牛客高級項目課（仿牛客網）筆記

【入門訓練】 Fibonacci數列

手寫數字識別——SVM和XGBOOST

鳶尾花——隨機森林分類模型(RandomForestClassifier)

Advertising.csv數據集——迴歸樹與XGBoost迴歸

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結