机器学习代码实战——线性回归(多变量)（Linear Regression）

原創

2020-04-10 14:36

文章目录

4.训练+预测

1.实验目的

在hiring.csv中，包含公司的招聘信息，例如候选人的工作经验，笔试成绩和个人面试成绩。基于这三个因素，人力资源将决定工资。有了这些数据，您需要为人力资源部门建立一个机器学习模型，以帮助他们确定未来应聘者的薪水。使用此预测薪水来预测以下候选人薪资，

（1）2年工作经验，测试成绩9，面试成绩6
（2）12年工作经验，测试分数10，面试分数10

2.导入必要模块并读取数据

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from word2number import w2n

df = pd.read_csv('hiring.csv')
df

3.对数据进行处理

3.1.experience字段数字化

df.experience = df.experience.fillna('zero')      #NaN统一替换为zero
df

df.experience = df.experience.apply(w2n.word_to_num)    #运用w2n.word_to_num将字母转化为数字
df

3.2.test_score(out of 10)字段NaN替换为平均数

import math

median_test_score = math.floor(df['test_score(out of 10)'].mean())   #取平均数并向下取整
median_test_score

#输出
7

df['test_score(out of 10)'] = df['test_score(out of 10)'].fillna(median_test_score)    #用平均数填充NaN
df

4.训练+预测

reg = LinearRegression()    #实例化模型
reg.fit(df[['experience','test_score(out of 10)','interview_score(out of 10)']],df['salary($)'])   #训练

reg.coef_     #系数
reg.intercept_   #截距

reg.predict([[2,9,6]])    #预测一
reg.predict([[12,10,10]])  #预测二

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

机器学习代码实战——线性回归(多变量)（Linear Regression）

文章目录

1.实验目的

2.导入必要模块并读取数据

3.对数据进行处理

3.1.experience字段数字化

3.2.test_score(out of 10)字段NaN替换为平均数

4.训练+预测

《日本蜡烛图》读书笔记 & 技术分析回测

《期货-市场技术分析》读书笔记

Python多线程编程深度探索：从入门到实战

mongodb处理json数据很好

35K*14 薪，入职了！这公司只要不裁员，我能一直呆下去！

劍指offer面試題63. 股票的最大利潤(動態規劃)

劍指offer面試題61. 撲克牌中的順子(排序)(遍歷)

Sklearn專題實戰——針對Category特徵進行分類

劍指offer面試題64. 求1+2+…+n(邏輯符短路)(遞歸)

劍指offer面試題65. 不用加減乘除做加法(位運算)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結