使用mnist進行訓練,將訓練集進行處理,指定一個分類,刪除大部分樣本。
各類樣本數如下
# 5444,6179,5470,5638,5307,4987,5417,5715,5389,5454
specified_class_idx = 3#指定一個類,數據縮水 delete_nums = 5000#刪5000個,還剩下638
觀察各集合預測結果
最低的線就是指定的,數據不均衡的“受害者”的測試集預測準確率。
最高的線就是受害者之外的其他類的測試集準確率。
中間兩條分別是訓練集通用準確率和測試集通用準確率,當然,訓練集略高於測試集。
測試集的平均準確率是綜合了指定類和其他類的。