MNIST 手寫數據集介紹
1、數據集介紹
- MNIST數據集是機器學習領域中非常經典的一個數據集,最簡單的方法就是使用如下代碼直接加載:
import tensorflow as tf
(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()
print(X_train.shape, y_train.shape)
print(X_test.shape, y_test.shape)
- 可以看出數據集由60000個訓練樣本和10000個測試樣本組成
- 每個樣本都是一張28 * 28像素的灰度手寫數字圖片
- 每個像素點是一個0-255的整數
2、打印第一個手寫圖片
import matplotlib.pyplot as plt
plt.figure()
plt.imshow(X_train[0])
plt.colorbar()
plt.grid(False)
plt.show()
3、打印前25張手寫數字
X_train = X_train / 255.0
X_test = X_test / 255.0
class_names = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
plt.figure(figsize=(10,10))
for i in range(25):
plt.subplot(5,5,i+1)
plt.xticks([])
plt.yticks([])
plt.grid(False)
plt.imshow(X_train[i], cmap=plt.cm.binary)
plt.xlabel(class_names[y_train[i]])