from sklearn.datasets import load_boston # 从skelan的数据集中导入数据
首先从标准库中导入数据集
dataset = load_boston() # 将数据集合中的数据赋值给dataset
x_data = dataset.data # 导入所有特征变量,赋值给x
y_data = dataset.target # 导入目标值(房价),赋值给Y
name_data = dataset.feature_names # 导入特征名
print(x_data)
print(y_data)
该数据集的数据结构是列表,然后将该数据集分为特征数据和目标数据x,y ,x数据的每一行表示一条数据的所有特征
y数据集只有一行数据,每一个数据表示该数据的目标
from sklearn.model_selection import train_test_split # 导入训练模块库函数
导入库函数,进行数据的分割,将数据分割为训练数据和测试数据,分割比为0.2
from sklearn.model_selection import train_test_split # 导入训练模块库函数
# 随机擦痒20%的数据构建测试样本,剩余作为训练样本
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data, random_state=0,test_size=0.20)
从标准库中导入训练模型
from sklearn.linear_model import LinearRegression # 导入线性训练模型
根据该训练模型对所有的训练数据进行训练
lr=LinearRegression()
#使用训练数据进行参数估计
lr.fit(X_train,y_train)
#回归预测
lr_y_predict=lr.predict(X_test) # 根据模型lr预测出的y的值
导入评估模型,对该模型的拟合程度进行评估
from sklearn.metrics import mean_squared_error
err = mean_squared_error(y_test, lr_y_predict)
print(err)