AI實戰:圖像數據增強方法彙總

數據集增強方法

  • 1、圖片縮放
    圖像縮放便是調節圖片的分辨率,可利用opencv-python庫resize()函數對圖片分辨率進行調節,在實際調節過程中,我們應保持在一定範圍內,可根據實驗反饋效果進行調整。

  • 2、圖片旋轉
    圖像按照給定的角度旋轉,可使用opencv-python中getRotationMatrix2D()函數和warpAffine()函數。示例代碼:

    height, width = img.shape[:2]
    M = cv2.getRotationMatrix2D((width/2, height/2), self.angle, 1)
    return cv2.warpAffine(img, M, (width, height))
    
  • 3、圖片平移
    將圖像往x、y方向上按指定的數量移動像素,可使用cv2.warpAffine()函數,自定義平移的方向和位移大小,示例代碼:

    height, width = img.shape[:2]
    trans_M = np.float32([[1, 0, self.x_trans], [0, 1, self.y_trans]])
    return cv2.warpAffine(img, trans_M, (width, height))
    
  • 4、圖片模糊
    常見方法如高斯模糊,可使用的是opencv-python中cv2.GaussianBlur()函數。

  • 5、圖片添加噪音
    可以添加多種類型噪音,如椒鹽噪音、高斯噪音,如常見的高斯噪音,使用skimage.util.random_noise()函數。

目標檢測數據增強方法

方法1:詳情點擊
方法2:詳情點擊,對應github鏈接:github鏈接
方法3:詳情點擊
方法4:詳情點擊,對應github鏈接:github鏈接,論文鏈接:1906.11172

手寫OCR圖像數據增強方法

方法:詳情點擊

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章