python機器學習-鳶尾花數據集以及訓練集和測試集劃分

首先需要從sklearn裏面引用鳶尾花數據集:

from sklearn.datasets import load_iris #引入鳶尾花加載函數load_iris
from sklearn.model_selection import train_test_split #引入訓練集、測試集劃分函數

輸出鳶尾花數據集屬性:

def datasets_demo():
     iris=load_iris() #bunch類型 繼承自字典   加載鳶尾花數據集 既包括特徵值也包括目標值
     print("鳶尾花數據集:\n",iris);
     print("特徵值的名字:\n",iris.feature_names);
     print("目標值:\n",iris.target);
     print("查看數據集描述:\n",iris.DESCR)
     print("查看特徵值size:\n",iris.data.shape);
     print("目標值名字:\n",iris.target_names)
     #test_size表示測試集所佔比例,random_state表示隨機數種子
     x_train, x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2,random_state= 22)
     print("訓練集的特徵值",x_train,x_train.shape)
     print("訓練集的目標值",y_train,y_train.shape)
     return None;
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章