A Preliminary Study on Data Augmentation of Deep Learning for Image Classification論文筆記

Attention:

論文解讀的博客原文發佈於個人github論文合集 歡迎關注,有想法歡迎一起討論!私信評論均可。

後面有些語法在CSDN的markdown上不支持,導致顯示bug,我就懶得改了,有需求直接訪問原博客查看。

創建人 github論文彙總 個人博客 知乎論文專欄
ming71 paperdaily chaser 專欄

順便mark我的數據增強代碼工具(持續更新):https://github.com/ming71/toolbox/tree/master/data_augmentation

論文發佈日期:2019.6.11<p/span>

1. Introduction

  這篇文章挺簡單(簡陋)的。語言組織和結構安排很糟糕,就是爲了先掛在arxiv上的,不是什麼正經文章,看看結論就行然後討論一下。
  文章研究了一些簡單的數據增強方法的效果對比,然後歸納出數據增強的幾個指導方向,結合上次看到谷歌的learned-augmentation能有點思考。結論:
(1)幾何變換作用好
(2)2-3倍的增強足夠
(3)小數據集更好

2. Experiment and Conclusion

2.1 Experiment Design

  作者的實驗選取增強方式除了常見的裁剪縮放平移等,還採取了直方圖均衡、曝光等多種複雜的色彩變換如下表:

  以及效果圖(CIFAR-10)如下。實驗做得挺一般沒什麼好看的,直接看結論。

2.2 Result and Rethink

  • 小數據集的效果更佳
      小數據集提升效果明顯,主要問題在於其容易過擬合

  • 幾何變換效果更好
      數據增強是爲了擬合實際出現的可能情況,而均衡、曝光等情況不常見,所以不如簡單的平移裁剪等多,效果自然也不如其好。一方面有測試集的侷限性,另一方面也能一定程度反映真實世界的圖像變化情況。

  • 關於增強能力是“一定程度”的思考:

  1. 《Why do deep convolutional networks generalize so poorly to small image transformations? Aharon》把這個叫做photographer bias,大部分照片(人眼視覺也是)都是有焦點角度的,可以認爲是某種同一性,數據增強如果擬合這些同一性,就能很好地實現效果提高。(極端如distortion類似的增強就基本不爲photographer關注)

  2. 增強個人感覺不是作者說的adding more feature,而應該是adding more useful feature,和上面我理解的同一性類似,正因此不同方案的增強纔有了顯著的性能差異。

  3. 一個悖論:檢測數據集的這種變化性也有體現,沒有真實世界強。涉及對數據集的理解,爲了更高的mAP,理論上可以追求同一性更強的檢測框架即可,但是現實世界變化性遠多於這個,這其中就有矛盾。




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章