SMOTE是處理樣本類別分佈不均衡的數據集的一種算法,它的全稱是Synthetic Minority Over-sampling TEchnique。顧名思義就是合成少數類別樣本的一種算法。它的靈感來自於做數字識別是對圖片進行翻轉等操作生成新樣本的方法。
下面是它的僞代碼:
參考:
1. Python的一個實現http://contrib.scikit-learn.org/imbalanced-learn/stable/generated/imblearn.over_sampling.SMOTE.html
2. 論文:SMOTE: Synthetic Minority Over-sampling Technique