文章目錄寫在前面1. 案例背景2. 解讀數據2. 導入數據進行數據分析及特徵工程2.1 概覽數據2.2 探索數據2.2.1 探索數據類型2.2.2 探索缺失值2.2.3 產生訓練集和測試集2.2.4 分析是否存在樣本不平衡問題2.
項目中出現了二分類數據不平衡問題,研究總結下對於類別不平橫問題的處理經驗: 1:爲什麼類別不平衡會影響模型的輸出: 許多模型的輸出類別是基於閾值的,例如邏輯迴歸中小於0.5的爲反例,大於則爲正例。在數據不平衡時,默認的閾值會導致模