A Preliminary Study on Data Augmentation of Deep Learning for Image Classification論文筆記

原創

chaser_ming7

2020-06-18 21:58

文章目錄

Attention:

論文解讀的博客原文發佈於個人github論文合集歡迎關注，有想法歡迎一起討論！私信評論均可。

後面有些語法在CSDN的markdown上不支持，導致顯示bug，我就懶得改了，有需求直接訪問原博客查看。

創建人	github論文彙總	個人博客	知乎論文專欄
ming71	paperdaily	chaser	專欄

順便mark我的數據增強代碼工具（持續更新）：https://github.com/ming71/toolbox/tree/master/data_augmentation

論文發佈日期：2019.6.11<p/span>

1. Introduction

這篇文章挺簡單（簡陋）的。~~語言組織和結構安排很糟糕，就是爲了先掛在arxiv上的，不是什麼正經文章~~，看看結論就行然後討論一下。
文章研究了一些簡單的數據增強方法的效果對比，然後歸納出數據增強的幾個指導方向，結合上次看到谷歌的learned-augmentation能有點思考。結論：
（1）幾何變換作用好
（2）2-3倍的增強足夠
（3）小數據集更好

2. Experiment and Conclusion

2.1 Experiment Design

作者的實驗選取增強方式除了常見的裁剪縮放平移等，還採取了直方圖均衡、曝光等多種複雜的色彩變換如下表：

以及效果圖（CIFAR-10）如下。實驗做得挺一般沒什麼好看的，直接看結論。

2.2 Result and Rethink

小數據集的效果更佳
小數據集提升效果明顯，主要問題在於其容易過擬合。
幾何變換效果更好
數據增強是爲了擬合實際出現的可能情況，而均衡、曝光等情況不常見，所以不如簡單的平移裁剪等多，效果自然也不如其好。一方面有測試集的侷限性，另一方面也能一定程度反映真實世界的圖像變化情況。
關於增強能力是“一定程度”的思考：

《Why do deep convolutional networks generalize so poorly to small image transformations? Aharon》把這個叫做photographer bias，大部分照片（人眼視覺也是）都是有焦點角度的，可以認爲是某種同一性，數據增強如果擬合這些同一性，就能很好地實現效果提高。（極端如distortion類似的增強就基本不爲photographer關注）
增強個人感覺不是作者說的adding more feature，而應該是adding more useful feature，和上面我理解的同一性類似，正因此不同方案的增強纔有了顯著的性能差異。
一個悖論：檢測數據集的這種變化性也有體現，沒有真實世界強。涉及對數據集的理解，爲了更高的mAP，理論上可以追求同一性更強的檢測框架即可，但是現實世界變化性遠多於這個，這其中就有矛盾。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

A Preliminary Study on Data Augmentation of Deep Learning for Image Classification論文筆記

文章目錄

1. Introduction

2. Experiment and Conclusion

2.1 Experiment Design

2.2 Result and Rethink

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

Learning Data Augmentation Strategies for Object Detection論文筆記

Further advantages of data augmentation on convolutional neural networks論文筆記

Improved Regularization of Convolutional Neural Networks with Cutout論文筆記

A Preliminary Study on Data Augmentation of Deep Learning for Image Classification論文筆記

Data Augmentation by Pairing Samples for Images Classification論文筆記

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結