17、Python特徵工程,用相關係數法選擇數據特徵

1 相關係數法

先計算各個特徵對目標值得相關係數,選擇更加相關的特徵

2 代碼案例


import pandas

data = pandas.read_csv('D:\\database\\pystudy\\6.2\\data2.csv')

# 導熱油特徵選擇的方法和相關係數的方法


from sklearn.feature_selection import f_regression

from sklearn.feature_selection import SelectKBest

# 代表選擇特徵值的數量

selectkBest=SelectKBest(
        f_regression,
        k=2
        )

# 選擇自變量

feature=data[['月份','季度','廣告費用','客流量']]

# 調用fit方法進行最好特徵的選擇

bestFeature=selectkBest.fit_transform(
        feature,
        data['銷售額']
        )

# 查看關鍵因子

feature.columns[selectkBest.get_support()]


 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章