數據集增強方法
-
1、圖片縮放
圖像縮放便是調節圖片的分辨率,可利用opencv-python庫resize()函數對圖片分辨率進行調節,在實際調節過程中,我們應保持在一定範圍內,可根據實驗反饋效果進行調整。 -
2、圖片旋轉
圖像按照給定的角度旋轉,可使用opencv-python中getRotationMatrix2D()函數和warpAffine()函數。示例代碼:height, width = img.shape[:2] M = cv2.getRotationMatrix2D((width/2, height/2), self.angle, 1) return cv2.warpAffine(img, M, (width, height))
-
3、圖片平移
將圖像往x、y方向上按指定的數量移動像素,可使用cv2.warpAffine()函數,自定義平移的方向和位移大小,示例代碼:height, width = img.shape[:2] trans_M = np.float32([[1, 0, self.x_trans], [0, 1, self.y_trans]]) return cv2.warpAffine(img, trans_M, (width, height))
-
4、圖片模糊
常見方法如高斯模糊,可使用的是opencv-python中cv2.GaussianBlur()函數。 -
5、圖片添加噪音
可以添加多種類型噪音,如椒鹽噪音、高斯噪音,如常見的高斯噪音,使用skimage.util.random_noise()函數。
目標檢測數據增強方法
方法1:詳情點擊
方法2:詳情點擊,對應github鏈接:github鏈接
方法3:詳情點擊
方法4:詳情點擊,對應github鏈接:github鏈接,論文鏈接:1906.11172
手寫OCR圖像數據增強方法
方法:詳情點擊