机器学习 -基于sklearn波士顿房价预测

from sklearn.datasets import load_boston  # 从skelan的数据集中导入数据

首先从标准库中导入数据集

dataset = load_boston()  # 将数据集合中的数据赋值给dataset
x_data = dataset.data  # 导入所有特征变量,赋值给x
y_data = dataset.target  # 导入目标值(房价),赋值给Y
name_data = dataset.feature_names  # 导入特征名
print(x_data)
print(y_data)

该数据集的数据结构是列表,然后将该数据集分为特征数据和目标数据x,y  ,x数据的每一行表示一条数据的所有特征

y数据集只有一行数据,每一个数据表示该数据的目标

from sklearn.model_selection import train_test_split  # 导入训练模块库函数

导入库函数,进行数据的分割,将数据分割为训练数据和测试数据,分割比为0.2

from sklearn.model_selection import train_test_split  # 导入训练模块库函数



# 随机擦痒20%的数据构建测试样本,剩余作为训练样本
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data, random_state=0,test_size=0.20)

从标准库中导入训练模型

from sklearn.linear_model import LinearRegression  # 导入线性训练模型

根据该训练模型对所有的训练数据进行训练

lr=LinearRegression()

#使用训练数据进行参数估计
lr.fit(X_train,y_train)
#回归预测
lr_y_predict=lr.predict(X_test)  # 根据模型lr预测出的y的值

导入评估模型,对该模型的拟合程度进行评估

from sklearn.metrics import mean_squared_error
err = mean_squared_error(y_test, lr_y_predict)
print(err)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章