1 相關係數法
先計算各個特徵對目標值得相關係數,選擇更加相關的特徵
2 代碼案例
import pandas
data = pandas.read_csv('D:\\database\\pystudy\\6.2\\data2.csv')
# 導熱油特徵選擇的方法和相關係數的方法
from sklearn.feature_selection import f_regression
from sklearn.feature_selection import SelectKBest
# 代表選擇特徵值的數量
selectkBest=SelectKBest(
f_regression,
k=2
)
# 選擇自變量
feature=data[['月份','季度','廣告費用','客流量']]
# 調用fit方法進行最好特徵的選擇
bestFeature=selectkBest.fit_transform(
feature,
data['銷售額']
)
# 查看關鍵因子
feature.columns[selectkBest.get_support()]