Tensorflow知識點總結（一）

原創

竹叶青lvye

2020-02-22 04:48

整理下零碎的知識點，方便以後查閱。大部分內容整理自《Tensorflow實戰Google深度學習框架》

數據集介紹

1. MNIST是NIST數據集的一個子集，6萬張訓練數據，1萬張測試數據，每一張代表了0~9的數字，圖片大小28*28，其來自美國國家標準與技術研究所。http://yann.lecun.com/exdb/mnist/。

2. Cifar-10和Cifar-100是圖像詞典項目中800萬張圖片的一個子集。他們由Alex Krizhevsky,Vinod Nair和Geoffrey Hinton收集。Cifar-10由10個類60000張32*32大小圖片組成；其中5萬張訓練樣本，1萬張測試樣本http://www.cs.toronto.edu/~kriz/cifar.html。

3. Cifar-100有100個類，每個類別600張圖片，500張訓練圖，100張測試圖。

4. ImageNet是一個基於WordNet的大型圖像數據庫，有近1500萬張圖片，李飛飛團隊從2007年開始，耗費大量人力開始，在CVRP-2009的一篇論文中提到，《ImageNet: A Large-Scale Hierarchical Image Database》。目前ImageNet中總共有14197122幅圖像，總共分爲21841個類別(synsets)。ILSVRC比賽會每年從ImageNet數據集中抽出部分樣本，以2012年爲例，比賽的訓練集包含1281167張圖片，驗證集包含50000張圖片，測試集爲100000張圖片。不是from scratch train一個網絡用到了ImageNet全部1千多萬的數據，ISLVRC 2012（ImageNet Large Scale Visual Recognition Challenge）比賽用的子數據集。因爲訓練集有128萬多，所以常見的訓練setting有256 batch size, 5000 iters/epoch,ImageNet 數據集最初由斯坦福大學李飛飛等人在 CVPR 2009 的一篇論文中推出，並被用於替代 PASCAL 數據集（後者在數據規模和多樣性上都不如 ImageNet）和 LabelMe 數據集（在標準化上不如 ImageNet）。

5. 2017年11月前後，谷歌的AutoML項目發展出新的神經網絡拓撲結構，創建了NASNet，這是一個針對ImageNet和COCO優化的系統。據Google稱，NASNet的性能超過了以前發佈的所有ImageNet性能。

6. 微軟發佈的 COCO 數據庫是一個大型圖像數據集, 專爲對象檢測、分割、人體關鍵點檢測、語義分割和字幕生成而設計。COCO的全稱是Common Objects in COntext。ImageNet與Pascal VOC數據集主要關注圖像分類、對象檢測與圖像語義分割，而COCO主要關注圖像場景與實例分割https://cloud.tencent.com/developer/article/1491614，但是每個分類的實例對象比ImageNet多，COCO有91個分類，其中82個分類每個都超過5000個實例對象，這些有助於更好的學習每個對象的位置信息，在每個類別的對象數目上也是遠遠超過PASCAL VOC數據集。圖像包括91類目標，328,000影像和2,500,000個label。目前爲止有語義分割的最大數據集，提供的類別有80 類，有超過33 萬張圖片，其中20 萬張有標註，整個數據集中個體的數目超過150 萬個。

7. PASCAL VOC爲圖像識別和分類提供了一整套標準化的優秀的數據集，從2005年到2012年每年都會舉行一場圖像識別challenge該挑戰主要包括三類任務：分類（classification），檢測（detection），和分割（segmentation）所有的標註圖片都有Detection需要的label，但只有部分數據有Segmentation Label。PASCAL VOC 2007 和 2012 數據集總共分 4 個大類：vehicle、household、animal、person，總共 20 個小類（加背景 21 類），

Person: person

Animal: bird, cat, cow, dog, horse, sheep

Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train

Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

PASCAL：pattern analysis, statistical modelling and computational learning

VOC：visual object classes

計算機視覺大賽介紹

1. ILSVRC（ImageNet Large Scale Visual Recognition Challenge）是近年來機器視覺領域最受追捧也是最具權威的學術競賽之一，代表了圖像領域的最高水平。2017年是最後一屆，2010年開始舉辦。

2. PASCAL VOC: Ran challenges evaluating performance on object class recognition (from 2005-2012, now finished) http://host.robots.ox.ac.uk/pascal/VOC/。

3. MS COCO 的全稱是常見物體圖像識別（Microsoft Common Objects in Context），起源於是微軟於2014年出資標註的Microsoft COCO數據集，同名競賽與此前著名的 ImageNet 競賽一樣，被視爲是計算機視覺領域最受關注和最權威的比賽之一。而在ImageNet競賽停辦後，COCO競賽就成爲是當前物體識別、檢測等領域的一個最權威、最重要的標杆，也是目前該領域在國際上唯一能彙集Google、微軟、Facebook 以及國內外衆多頂尖院校和優秀創新企業共同參與的大賽。