python構造數據比例新特徵

特徵工程構造新特徵時, 可以考慮構造比例特徵: 該特徵爲某標籤時所佔總數據的比例.

ratio = {}
for i in data.A.unique():
	ratio[i] = len(data.loc[(data.A == i) & (data.label == 1)]) / len(data.loc[data.A == i])

data['ratio_A'] = data.A.map(ratio)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章