augmentor

原創

suxi的deep_travel

2019-01-05 20:41

作爲一個圖像處理，以及計算機視覺領域的一個小兵，在使用深度學習算法的過程中經常需要寫一些圖像增強的simple code。雖然不同的計算框架多多少少的都實現了不同的數據增強方法，但是個人認爲使用起來還不是很方便，難以滿足需求。尤其是涉及到一些相對“複雜”的數據增強手段，例如，物體檢測，關鍵點檢測，語義分割等任務，對圖像做矩陣操作的同時還需要對標註信息做變換。
自己實現的方法用起來也會順手一些，可控性也更高。
所以，自己構建了一個小小的augmentor，主要依賴於opencv和numpy。

下面我們來逐步，看一下這個小小的augmentor。

工程地址git

從pytorch tutorial中下載數據 facedata，
並解壓到工程目錄下：

看一下圖像
依次是原始圖像，旋轉，帶label旋轉，仿射變換，heatmap，img_drop,blur，padding 和mirror。
圖像變換可以插入到你的data flow 的圖像增強管道里，隨着更多的需求，這個小lib會支持更多的圖像變換。
還有一些顏色，對比度等的變化，一般框架都支持，就不在多做重複工作。

原理上也沒有很複雜，只是簡單的矩陣運算，細節以及使用方法，在test.py

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

論文筆記之Fully Convolutional Networks for Semantic Segmentation

最近了解到了Image Semantic Segmentation方面的知識，在此做一個記錄。這篇論文是2015cvpr的best paper，可以說是在cnn上做圖像語義分割的開山之作。 1.語義分割定義：語義就是指物體的

2020-07-08 10:23:34

Deep Learning 之參數初始化

本文僅對常見的參數初始化方法進行總結（大部分內容來自deep learning一書），原理性的問題不進行過多的探討。 Deep Learning中參數初始化十分重要，一般來說有以下這些原因： 1.初始點的選取，有時候能夠決定算法

2020-07-08 10:23:34

【轉載】技術向：一文讀懂卷積神經網絡

原文地址：http://toutiao.com/a4033463198/?tt_from=sina&app=news_article&iid=2585754491&utm_medium=toutiao_android&utm_campai

2020-07-07 07:13:56

簡單理解CNN的padding如何計算

簡單理解CNN的padding如何計算一、說明二、計算三、技巧分享一、說明先看pytorch卷積層設置參數 nn.Conv2d( in_channels=1, #input height ou

2020-07-07 06:34:28

個人總結：機器學習與算法工程師方向面試題及答案（持續更新）

機器學習與算法工程師方向面試題及答案1.快速排序2.列表中是否有這個數——二分查找3.拉格朗日對偶性4.k-means原理及複雜度5.邏輯迴歸和SVM區別6.過擬合問題怎麼解決7.PCA降維8.特徵工程之特徵選擇、組合、提取、篩選

2020-07-07 06:34:28

自然語言幾個重要的模型

自然語言幾個重要的模型。循環神經網絡 (序列模型序列依賴問題) 雙向循環神經網絡（輸入序列正向和反向依賴問題）深度雙向循環神經網絡 LSTM（梯度消失問題） GRU text CNN（一維卷積和池化） seq2seq（序列到

2020-07-06 22:44:07

模型實踐（二）bert 中文語料分類

1.下載bert源代碼和中文預訓練模型 bert代碼模型下載 Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameter

2020-07-06 22:44:07

關鍵詞提取-TFIDF 自定義逆文檔IDF的值

TF-IDF 用於提取關鍵詞，那麼如何從多個文檔中提取出關鍵詞。文章的關鍵詞可能有什麼規律，表示文章主要意思，那這個詞應該在該文章中出現多次，但是在其他文章中出現次數不多。 TF 詞頻（Term Frequency）表示w在文檔

2020-07-06 22:43:56

模型實踐（一）RNN LSTM 中文分類

對之前一節部分進行實踐，使用keras進行實現，keras關於循環神經網絡有多個方法。https://keras.io/zh/layers/recurrent/ SimpleRNN LSTM+CNN 樣本使用ai挑戰賽用戶評

2020-07-06 22:43:56

ResNet之mxnet、keras、pytorch實現

目錄 1、ResNet50的mxnet實現 2、ResNet的keras實現 3、ResNet的pytorch實現 1、ResNet50的mxnet實現具體網絡結構可參見https://blog.csdn.net/qq_210461

2020-07-05 13:30:37

tensorflow2.1報no attribute 'Summary' && tf.contrib.summary instead

前後遇到兩個錯 1、AttributeError: module tensorflow has no attribute 'Summary' 通過將 tf.Summary 換成 tf.compat.v1.Summary，可利用ten

2020-07-05 09:59:45

基於DL的計算機視覺（2）--實現圖像分類最簡單的方法：KNN

1. 圖像分類問題這是人每天自然而然會做的事情，普通到大部分時候，我們都感知不到我們在完成一個個這樣的任務。早晨起牀洗漱，你要看看洗漱臺一堆東西中哪個是杯子，哪個是你的牙刷；喫早餐的時候你要分辨食物和碗碟… 抽象一下，對於一張輸

2020-07-04 22:45:57

基於DL的計算機視覺（3）-- SVM和Softmax分類器

1. 線性分類器在深度學習與計算機視覺系列(2)我們提到了圖像識別的問題，同時提出了一種簡單的解決方法——KNN。然後我們也看到了KNN在解決這個問題的時候，雖然實現起來非常簡單，但是有很大的弊端：分類器必須記住全部的訓練數

2020-07-04 22:45:57

基於DL的計算機視覺（4）-- SGD

1. 引言上一節深度學習與計算機視覺系列(3)_線性SVM與SoftMax分類器中提到兩個對圖像識別至關重要的概念：用於把原始像素信息映射到不同類別得分的得分函數/score function用於評估參數W效果(評估該參數下

2020-07-04 22:45:57

基於DL的計算機視覺（1）-- Python基礎介紹

1.背景計算機視覺/computer vision是一個火了N年的topic。持續化升溫的原因也非常簡單：在搜索/影像內容理解/醫學應用/地圖識別等等領域應用太多，大家都有一個願景『讓計算機能夠像人一樣去”看”一張圖片，甚至”讀

2020-07-04 22:45:57

24小時熱門文章

最新文章

最新評論文章