科技巨頭如Google,微軟,亞馬遜等都紛紛宣佈在AI領域佈局,AI的影響隨着深度學習的應用日益深入。機器視覺作爲一個熱門子領域,無論是在傳統金融行業還是最新自動駕駛領域都掀起了一股學習應用的浪潮。
這是多麼棒的一件事啊!
但是我們應該如何簡單的開始研究機器視覺?以下是幾個主要的步驟
1.收集大量的數據
2.標註這些數據
3.拿到GPUs-訓練ML模型需要強大的計算支撐
4.選擇一個算法-訓練你的模型-檢測結果-教會你的模型它還不知道的東西
重複以上步驟直到你得到的滿意的模型準確率
以上5步中的每一步都有他們自己的技術和操作注意事項。在這篇文章中,我們會針對第2條(標註訓練數據)來進行簡單的講解
機器視覺得幾個廣泛應用案例:
自動駕駛車輛(waymo,Tesla,Cruise)-一個自動駕駛的車輛需要識別出它前方的物體(和後方!),是一輛車,路標,行人或者是一隻流浪的公雞。
無人機-亞馬遜想要利用無人機來爲客戶送貨,那麼無人機需要知道在他們前方的物體以便於他們不會撞上飛行中的鳥或者電線。無人機也被廣泛應用於安全安防和軍隊偵查
地圖和衛星(mapbox,Here,Orbital Insight)-衛星拍攝圖片的數量呈現出爆發性增長!這些數據可以用來確認颱風中是否有倖存者,使地圖內容更豐富甚至通過計算沃爾瑪停車場的車輛來預測銷售情況
機器人--機器視覺用來構建可以識別並且從貨架上取下某類商品的機器人手臂或者工業自動化甚至玩網球
OCR/BFSI-對信用卡評級,貸款申請等文檔自動轉寫或者轉寫其他的手寫文檔等
醫療行業-在機器視覺協助的手術中,機器手臂需要識別特定的手術工具
智能農業-有一位日本的研究員利用機器視覺幫助他父母的農場給黃瓜分類,他們發現ML在通過黃瓜尺寸,形狀,顏色和其他必要參數的分類表現突出
第一步首先是要收集數據,當你開始時,可以嘗試一下幾個很棒的免費或者付費數據集:
- Common Objects in Context (COCO)
- ImageNet
- Google’s Open Images
- KITTI
- The University of Edinburgh School of Informatics’ CVonline: Image Databases
- Yet Another Computer Vision Index To Datasets (YACVID)
- mldata.org
- CV datasets on GitHub
- ComputerVisionOnline.com
- UCI Machine Learning Repository
- Udacity Self driving car datasets
- Cityscapes Dataset
- Autonomous driving dataset by Comma.ai
- MNIST handwritten datasets
這些數據集對於學習機器視覺的新手而言是一個很好的開始。甚至對於一個不是很重要的項目,這些數據也足夠來搭建一個簡單的模型,但是對於很多公司型或者大型項目,顯然不夠
要想提升你們CV模型的準確度,你需要用模型在現實中需要檢測的數據類型來訓練它。這些數據通常是很細緻的,不同於我們通常可以從網上獲得數據集
有很多方法可以收集數據,比如你可以從網上爬取數據或者像谷歌那種巨頭一樣利用用戶收集的數據或者從汽車攝像機中收集的數據,你甚至可以向別人購買數據集
一旦你得到了數據,你就需要標註它們,你需要考慮2個問題
如何標註數據?
誰來標註數據
注意:本文中說的數據特指圖片數據
選擇圖像標註工具
網上有很多可以免費試用的數據標註工具,然後選擇一個正確的標註工具有時候不是那麼簡單,下面是幾個選擇時可以參考的因素:
搭建工具運行需要花費的時間和精力
標註準確度
標註速度
一些流行的圖片標註工具(需要MIT許可)
Comma coloring--在Comma 自動駕駛技術環境中幫助訓練機器學習,比如提供給你一張車載攝像頭的圖片並且要求你把圖片中的不同區域塗上不同的顏色,比如圖片中的哪個區域是天空,哪個區域是道路,識別交通信號燈等等,這個工具是開源的
Annotorious-可以在網頁上的圖片上標註比如畫框並且註釋內容。比如在一張圖片中把狗框選出來並且註釋這是一條狗。需要MIT認證,可以免費用於商業和非商業項目
LabelMe-幫助機器視覺研究建立圖片數據庫。你可以通過訪問標註工具來增添這個數據集的內容
另外幾個靠譜的開源標註工具:
- Alp’s Labeling Tools for Deep Learning
- RectLabel
- VGG Image Annotator (VIA)
- Szoter
- LEAR Image Annotation tool by Alexander Kläser
- Image Annotator Plugin for Drupal
- Demon Image Annotation Plugin for WordPress
- Landmarker.io , Sloth , vatic , ViPER-GT , Fiji , MediaTeam GTEditor ,LabelD and Imglab