2 備註
2.1 在競賽中,可以會出現提供的數據不符合測試集分佈的情況
根據百度車道線冠軍的經驗:
數據清洗上,最一開始採用了全部數據訓練,發現loss經常出現不規則的跳動,經過排查,發現road 3存在幾乎一半以上圖像過曝的問題,並且road 3大多在強光下拍攝,不符合測試集的分佈,所以很果斷的捨棄了road 3,分數也提升了0.01左右(好神奇。。。)。
這就說明了,在數據來源不同的情況下,很可能出現訓練集與測試集分佈不一致的情況;
根據百度車道線冠軍的經驗:
數據清洗上,最一開始採用了全部數據訓練,發現loss經常出現不規則的跳動,經過排查,發現road 3存在幾乎一半以上圖像過曝的問題,並且road 3大多在強光下拍攝,不符合測試集的分佈,所以很果斷的捨棄了road 3,分數也提升了0.01左右(好神奇。。。)。
這就說明了,在數據來源不同的情況下,很可能出現訓練集與測試集分佈不一致的情況;