1 方差選擇法
先計算各個特徵的方差,選擇方差大於閾值的特徵
2 案例
import pandas
data = pandas.read_csv('D:\\database\\pystudy\\6.2\\data1.csv')
# 查看數據框裏邊的數據類型
data.dtypes
# 導入計算方差的方法
from sklearn.feature_selection import VarianceThreshold
# 定義閾值爲1
varianceThreshold=VarianceThreshold(threshold=1)
# 調用fit_transform的方法對特徵值進行過濾
# data['累計票房']=data['累計票房'].astype('float')
varianceThreshold.fit_transform(data[['票房','評分']])
# 查看方差
data[['票房', '評分']].std()
varianceThreshold = VarianceThreshold(threshold=3)
varianceThreshold.fit_transform(data[['票房', '評分']])
varianceThreshold.get_support()