數據增強(檢測,分類,識別):1708.Random Erasing Data Augmentation 論文筆記

Random Erasing Data Augmentation 論文下載地址:https://arxiv.org/abs/1708.04896


詳細信息
這裏寫圖片描述
論文資源代碼:
https://github.com/zhunzhong07/Random-Erasing


論文解讀
首先,爲了增強模型的泛化的性能,一般的手段有數據增強和正則化方法(如dropout,BN),而用於數據增強的一般方法有:隨機裁剪、隨機水平翻轉、平移、旋轉、增加噪音和生成網絡方法等(前兩個方法用的最多,也最有效),作者從CNNs輸入的數據預處理出發,極端的情況下,如果訓練模型的數據集很少有遮擋的樣本(儘管放大再隨機裁剪一定程度對應對遮擋的情形上有幫助),那麼最終訓練得到的模型也不能很好處理遮擋情景,爲了使訓練的模型更好的應對作爲影響模型泛化能力的重要而關鍵的因素–遮擋,作者提出了很簡單且實用的無參數數據增強方法—Random Erasing(也可以被視爲add noise的一種)。該方法被證明在多個CNN架構和不同領域中可以提升模型的性能和應對遮擋的魯棒性,並且與隨機裁剪、隨機水平翻轉(還有正則化方法)具有一定的互補性,綜合應用他們,可以取得更好的模型表現,尤其是對噪聲和遮擋具有更好的魯棒性。
該方法可以很容易嵌入到現今大部分CNN模型中用於訓練具有更好泛化性能的模型。

作者證明Random Erasing可以取得最好性能的一般過程如下:
隨機0一定概率確定是否對一張被選擇的圖像進行處理,確定處理後,以一定的面積比範圍和高寬比限制,並在不超過圖像W和H的圖像內隨機選擇一塊矩形區域,給像素賦隨機值或者[125.0,122.0,114.0](平均值即ImageNet mean pixel value)。算法圖示,如下:
這裏寫圖片描述

以圖像分類和行人重識別爲例,隨機擦除數據增強,示例:
這裏寫圖片描述

以目標檢測爲例,隨機擦除數據增強,示例:
其中,分三種情況,IRE:Image-aware Random Erasing不區分目標框和背景區域,在整個圖像來做擦除處理;ORE:區分目標框和背景區域,來做擦除處理,只在目標框內做擦除處理; I+ORE:區分目標框和背景區域,分別在目標框和整個圖像來做擦除處理
這裏寫圖片描述

隨機擦除和隨機裁剪的區別:

這裏寫圖片描述


實驗
作者實驗用的數據集有:
圖像分類實驗:CIFAR-10 and CIFAR-100 and Fashion-MNIST
目標檢測:PASCAL VOC 2007/ PASCAL VOC 2012
行人重識別:Market-1501、DukeMTMC-reID、CUHK03(該數據集較小,用隨機擦除可緩解複雜模型的過擬合)

隨機擦除操作涉及的參數設置:面積比即Reasing area ratio rang閾值限(區間下限和上限決定了遮擋的級別)(level),高寬比Reasing aspect ratio rang閾值限,隨機擦除概率(Erasing probability)

1.圖像分類實驗
數據集上的實驗
這裏寫圖片描述
隨機擦除操作涉及的參數(超參數影響)
這裏寫圖片描述

得出下面跟隨的實驗,無特別說明,採用的參數設置爲:
這裏寫圖片描述

隨機擦除的四種不同的賦值類型對比:
這裏寫圖片描述

與dropout和隨機添加噪聲的實驗比較:可以看出只有隨機擦除有助於提升性能
這裏寫圖片描述

和其他數據增強方法的比較:說明隨機擦除是與隨機裁剪和隨機水平翻轉具有同樣的競爭力,並具有一定的互補性
這裏寫圖片描述

對遮擋的魯棒性實驗:說明無隨機擦除和有隨機擦除隨着遮擋區域的級別(佔整個圖像的面積)增大,後者drops的更慢,更低。即隨機擦除可以提升CNNs對遮擋的魯棒性。
這裏寫圖片描述

2.目標檢測實驗
IRE:Image-aware Random Erasing不區分目標框和背景區域,在整個圖像來做擦除處理;ORE:區分目標框和背景區域,來做擦除處理,只在目標框內做擦除處理; I+ORE:區分目標框和背景區域,分別在目標框和整個圖像來做擦除處理
分析:表格上面部分是training with VOC07 trainval,下面部分的是The detector is trained with two training set, VOC07 trainval and union of VOC07 and VOC12 trainval.
這裏寫圖片描述

3.行人重識別實驗
實驗設置:
這裏寫圖片描述

這裏寫圖片描述

不同數據集上對各方法的性能提升
這裏寫圖片描述
這裏寫圖片描述


涉及的一些有價值的論文
regularization methods
A. Krizhevsky, I. Sutskever, and G. E. Hinton. Imagenet classification with deep convolutional neural networks. In NIPS, 2012. 1, 2
L. Wan, M. Zeiler, S. Zhang, Y. L. Cun, and R. Fergus. Regularization of neural networks using dropconnect. In ICML, 2013
J. Ba and B. Frey. Adaptive dropout for training deep neural networks. In NIPS, 2013
M. D. Zeiler and R. Fergus. Stochastic pooling for regularization of deep convolutional neural networks. In ICLR, 2013
L. Xie, J. Wang, Z. Wei, M. Wang, and Q. Tian. Disturblabel: Regularizing cnn on the loss layer. In CVPR, 2016
G. Kang, X. Dong, L. Zheng, and Y. Yang. Patchshuffle regularization. arXiv preprint arXiv:1707.07103, 2017


總結:對於行人重識別來說,對不同的reid方法,同時應用該文的隨機擦除數據增強和最新的re-ranking方法,是個比較好的選擇,對提升reid識別率會很有幫助

發佈了94 篇原創文章 · 獲贊 67 · 訪問量 19萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章