原创 Github項目 hadoop-imbalanced-preprocessing 如何運行

源起: hadoop-imbalanced-preprocessing是基於MapReduce實現的隨機過採樣,隨機欠採樣和SMOTE算法的程序,它主要解決在大數據環境下類別不平衡問題的數據預處理的問題。該項目直接集成在Mahout項目的