16、python用方差方法選擇數據特徵

1 方差選擇法

 先計算各個特徵的方差,選擇方差大於閾值的特徵

2 案例

import pandas

data = pandas.read_csv('D:\\database\\pystudy\\6.2\\data1.csv')

# 查看數據框裏邊的數據類型

data.dtypes

# 導入計算方差的方法

from sklearn.feature_selection import VarianceThreshold

# 定義閾值爲1

varianceThreshold=VarianceThreshold(threshold=1)

# 調用fit_transform的方法對特徵值進行過濾


# data['累計票房']=data['累計票房'].astype('float')


varianceThreshold.fit_transform(data[['票房','評分']])

# 查看方差

data[['票房', '評分']].std()

varianceThreshold = VarianceThreshold(threshold=3)

varianceThreshold.fit_transform(data[['票房', '評分']])

varianceThreshold.get_support()



 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章