augmentor

作爲一個圖像處理,以及計算機視覺領域的一個小兵,在使用深度學習算法的過程中經常需要寫一些圖像增強的simple code。雖然不同的計算框架多多少少的都實現了不同的數據增強方法,但是個人認爲使用起來還不是很方便,難以滿足需求。尤其是涉及到一些相對“複雜”的數據增強手段,例如,物體檢測,關鍵點檢測,語義分割等任務,對圖像做矩陣操作的同時還需要對標註信息做變換。
自己實現的方法用起來也會順手一些,可控性也更高。
所以,自己構建了一個小小的augmentor,主要依賴於opencv和numpy。

下面我們來逐步,看一下這個小小的augmentor。

工程地址git

從pytorch tutorial中下載數據 facedata
並解壓到工程目錄下:

看一下圖像在這裏插入圖片描述
依次是原始圖像,旋轉,帶label旋轉,仿射變換,heatmap,img_drop,blur,padding 和mirror。
圖像變換可以插入到你的data flow 的圖像增強管道里,隨着更多的需求,這個小lib會支持更多的圖像變換。
還有一些顏色,對比度等的變化,一般框架都支持,就不在多做重複工作。

原理上也沒有很複雜,只是簡單的矩陣運算,細節以及使用方法,在test.py

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章