目標檢測——數據清洗的學習筆記

2 備註

2.1 在競賽中,可以會出現提供的數據不符合測試集分佈的情況

根據百度車道線冠軍的經驗:

數據清洗上,最一開始採用了全部數據訓練,發現loss經常出現不規則的跳動,經過排查,發現road 3存在幾乎一半以上圖像過曝的問題,並且road 3大多在強光下拍攝,不符合測試集的分佈,所以很果斷的捨棄了road 3,分數也提升了0.01左右(好神奇。。。)。

這就說明了,在數據來源不同的情況下,很可能出現訓練集與測試集分佈不一致的情況;

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章