樣本不均衡

使用mnist進行訓練,將訓練集進行處理,指定一個分類,刪除大部分樣本。

各類樣本數如下

# 5444,6179,5470,5638,5307,4987,5417,5715,5389,5454
specified_class_idx = 3#指定一個類,數據縮水
delete_nums = 5000#刪5000個,還剩下638

 

觀察各集合預測結果

最低的線就是指定的,數據不均衡的“受害者”的測試集預測準確率。

最高的線就是受害者之外的其他類的測試集準確率。

中間兩條分別是訓練集通用準確率和測試集通用準確率,當然,訓練集略高於測試集。

測試集的平均準確率是綜合了指定類和其他類的。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章