首先來看一下,tensorflow dataset都集成了哪些數據集
>>> import tensorflow_datasets as tfds
>>> print(tfds.list_builders())
['bair_robot_pushing_small', 'cats_vs_dogs', 'celeb_a', 'celeb_a_hq', 'cifar10', 'cifar100', 'coco2014', 'diabetic_retinopathy_detection', 'dummy_dataset_shared_generator', 'dummy_mnist', 'fashion_mnist', 'image_label_folder', 'imagenet2012', 'imdb_reviews', 'lm1b', 'lsun', 'mnist', 'moving_mnist', 'nsynth', 'omniglot', 'open_images_v4', 'quickdraw_bitmap', 'squad', 'starcraft_video', 'svhn_cropped', 'tf_flowers', 'wmt_translate_ende', 'wmt_translate_enfr']
一、音頻類
nsynth
二、圖像類
cats_vs_dogs
celeb_a:CelebFaces Attributes Dataset(CelebA)是一個大型人臉屬性數據集,擁有超過200K名人圖像,每個圖像都有40個屬性註釋。https://blog.csdn.net/weixin_41036461/article/details/83109444
celeb_a_hq:高質量人臉圖像
cifar10:是由AlexKrizhevsky、VinodNair與GeoffreyHinton收集的一個圖像識別的數據集,有10類,飛機、汽車、鳥、貓、鹿、狗、青蛙、馬、船..https://blog.csdn.net/bryant_meng/article/details/81077196
cifar100
coco2014
colorectal_histology
colorectal_histology_large
diabetic_retinopathy_detection
fashion_mnist
image_label_folder
imagenet2012
lsun:場景分類的10個場景類別。LSUN 是一個場景理解圖像數據集,主要包含了臥室、固房、客廳、教室等場景圖像。
mnist:手寫數字數據集
omniglot
open_images_v4
quickdraw_bitmap
svhn_cropped
tf_flowers
三、結構化數據集
titanic
四、文本類
imdb_reviews
lm1b
squad
五、翻譯類
wmt_translate_ende
wmt_translate_enfr
六、視頻類
bair_robot_pushing_small
moving_mnist
starcraft_video