特徵工程構造新特徵時, 可以考慮構造比例特徵: 該特徵爲某標籤時所佔總數據的比例.
ratio = {}
for i in data.A.unique():
ratio[i] = len(data.loc[(data.A == i) & (data.label == 1)]) / len(data.loc[data.A == i])
data['ratio_A'] = data.A.map(ratio)
特徵工程構造新特徵時, 可以考慮構造比例特徵: 該特徵爲某標籤時所佔總數據的比例.
ratio = {}
for i in data.A.unique():
ratio[i] = len(data.loc[(data.A == i) & (data.label == 1)]) / len(data.loc[data.A == i])
data['ratio_A'] = data.A.map(ratio)
繼續運行 ?* 回憶上次內容 上次使用shell環境中的命令 命令 作用 c
01 綜述 Opal 是愛奇藝大數據團隊研發的機器學習平臺,包含特徵生產、樣本構建、模型訓練、模型部署在內的多環節 Bigdata + AI 開發服務,內置多種訓練鏡像、