Tensorflow知識點總結(一)

整理下零碎的知識點,方便以後查閱。大部分內容整理自《Tensorflow實戰Google深度學習框架》

 

數據集介紹

1. MNIST是NIST數據集的一個子集,6萬張訓練數據,1萬張測試數據,每一張代表了0~9的數字,圖片大小28*28,其來自美國國家標準與技術研究所。http://yann.lecun.com/exdb/mnist/。

2. Cifar-10和Cifar-100是圖像詞典項目中800萬張圖片的一個子集。他們由Alex Krizhevsky,Vinod Nair和Geoffrey Hinton收集。Cifar-10由10個類60000張32*32大小圖片組成;其中5萬張訓練樣本,1萬張測試樣本http://www.cs.toronto.edu/~kriz/cifar.html。

3. Cifar-100有100個類,每個類別600張圖片,500張訓練圖,100張測試圖。

4. ImageNet是一個基於WordNet的大型圖像數據庫,有近1500萬張圖片,李飛飛團隊從2007年開始,耗費大量人力開始,在CVRP-2009的一篇論文中提到,《ImageNet: A Large-Scale Hierarchical Image Database》。目前ImageNet中總共有14197122幅圖像,總共分爲21841個類別(synsets)。ILSVRC比賽會每年從ImageNet數據集中抽出部分樣本,以2012年爲例,比賽的訓練集包含1281167張圖片,驗證集包含50000張圖片,測試集爲100000張圖片。不是from scratch train一個網絡用到了ImageNet全部1千多萬的數據,ISLVRC 2012(ImageNet Large Scale Visual Recognition Challenge)比賽用的子數據集。因爲訓練集有128萬多,所以常見的訓練setting有256 batch size, 5000 iters/epoch,ImageNet 數據集最初由斯坦福大學李飛飛等人在 CVPR 2009 的一篇論文中推出,並被用於替代 PASCAL 數據集(後者在數據規模和多樣性上都不如 ImageNet)和 LabelMe 數據集(在標準化上不如 ImageNet)。

5. 2017年11月前後,谷歌的AutoML項目發展出新的神經網絡拓撲結構,創建了NASNet,這是一個針對ImageNet和COCO優化的系統。 據Google稱,NASNet的性能超過了以前發佈的所有ImageNet性能。

6. 微軟發佈的 COCO 數據庫是一個大型圖像數據集, 專爲對象檢測、分割、人體關鍵點檢測、語義分割和字幕生成而設計。COCO的 全稱是Common Objects in COntext。ImageNet與Pascal VOC數據集主要關注圖像分類、對象檢測與圖像語義分割,而COCO主要關注圖像場景與實例分割https://cloud.tencent.com/developer/article/1491614,但是每個分類的實例對象比ImageNet多,COCO有91個分類,其中82個分類每個都超過5000個實例對象,這些有助於更好的學習每個對象的位置信息,在每個類別的對象數目上也是遠遠超過PASCAL VOC數據集。圖像包括91類目標,328,000影像和2,500,000個label。目前爲止有語義分割的最大數據集,提供的類別有80 類,有超過33 萬張圖片,其中20 萬張有標註,整個數據集中個體的數目超過150 萬個。

7. PASCAL VOC爲圖像識別和分類提供了一整套標準化的優秀的數據集,從2005年到2012年每年都會舉行一場圖像識別challenge該挑戰主要包括三類任務:分類(classification),檢測(detection),和分割(segmentation) 所有的標註圖片都有Detection需要的label, 但只有部分數據有Segmentation Label。PASCAL VOC 2007 和 2012 數據集總共分 4 個大類:vehicle、household、animal、person,總共 20 個小類(加背景 21 類),

Person: person

Animal: bird, cat, cow, dog, horse, sheep

Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train

Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

PASCAL:pattern analysis, statistical modelling and computational learning

VOC:visual object classes

 

計算機視覺大賽介紹

1. ILSVRC(ImageNet Large Scale Visual Recognition Challenge)是近年來機器視覺領域最受追捧也是最具權威的學術競賽之一,代表了圖像領域的最高水平。2017年是最後一屆,2010年開始舉辦。

2. PASCAL VOC: Ran challenges evaluating performance on object class recognition (from 2005-2012, now finished) http://host.robots.ox.ac.uk/pascal/VOC/。

3. MS COCO 的全稱是常見物體圖像識別(Microsoft Common Objects in Context),起源於是微軟於2014年出資標註的Microsoft COCO數據集,同名競賽與此前著名的 ImageNet 競賽一樣,被視爲是計算機視覺領域最受關注和最權威的比賽之一。而在ImageNet競賽停辦後,COCO競賽就成爲是當前物體識別、檢測等領域的一個最權威、最重要的標杆,也是目前該領域在國際上唯一能彙集Google、微軟、Facebook 以及國內外衆多頂尖院校和優秀創新企業共同參與的大賽。

 

發佈了24 篇原創文章 · 獲贊 24 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章