TF2-歸一化

TF2-歸一化

原創

2020-02-23 01:40

# 歸一化：
# １:把數據變成(０，１)或者（1,1）之間的小數。主要是爲了數據處理方便提出來的，把數據映射到0～1範圍之內處理，更加便捷快速。
# ２:把有量綱表達式變成無量綱表達式，便於不同單位或量級的指標能夠進行比較和加權。
#   歸一化是一種簡化計算的方式，即將有量綱的表達式，經過變換，化爲無量綱的表達式，成爲純量。

歸一化算法有：
1、線性變換
y=(x-MinValue)/(MaxValue-MinValue)
2、對數函數轉換
y = log10(x)
3、反餘切函數轉換
y = atan(x)*2/PI

import tensorflow as tf
from tensorflow import keras
import matplotlib as mpl
from matplotlib import pyplot as plt
%matplotlib inline
import sklearn
import numpy as np
import pandas as pd
import os
import sys
import time

#Get data:
fashion_mnist = keras.datasets.fashion_mnist                             #download the mnist data
(x_train_all,y_train_all),(x_test,y_test) = fashion_mnist.load_data()    #split data to train and test
x_valid ,x_train = x_train_all[:5000],x_train_all[5000:]                 #splot train data to train and valid
y_valid ,y_train = y_train_all[:5000],y_train_all[5000:]                 #splot train data to train and valid
print(x_valid.shape,y_valid.shape)
print(x_train.shape,y_train.shape)
print(x_test.shape,y_test.shape)

(5000, 28, 28) (5000,)
(55000, 28, 28) (55000,)
(10000, 28, 28) (10000,)

print(np.max(x_train),np.min(x_train))

255 0

#Normalization或StandarScaler(歸一化)
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()

#歸一化訓練集,歸一化輸入的是float類型的二維數據,所以先轉化爲二維數據,得到結果之後在把shape換回來
x_train_scaled = scaler.fit_transform(         
    x_train.astype(np.float32).reshape(-1,1)
).reshape(-1,28,28)
#歸一化驗證集
x_valid_scaled = scaler.transform(
    x_valid.astype(np.float32).reshape(-1,1)
).reshape(-1,28,28)
#歸一化測試集
x_test_scaled = scaler.transform(
    x_test.astype(np.float32).reshape(-1,1)
).reshape(-1,28,28)

print(np.max(x_train_scaled),np.min(x_train_scaled))

2.0231433 -0.8105136

# Tf.keras.Sequential (bulit model)
model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape = (28,28)))
model.add(keras.layers.Dense(300,activation = "relu"))
model.add(keras.layers.Dense(100,activation = "relu"))
model.add(keras.layers.Dense(10,activation = "softmax"))

#relu : y = max(x,0)
#softmax : change vertor to probability distributions

#why sparse: y-> index  ,y ->one hot->[](vector)
model.compile(
    loss = "sparse_categorical_crossentropy",
    optimizer = "sgd",
    metrics = ["accuracy"]
            )

#Train
history = model.fit(x_train_scaled,y_train,epochs=10,validation_data=(x_valid_scaled,y_valid))

Train on 55000 samples, validate on 5000 samples
Epoch 1/10
55000/55000 [==============================] - 4s 80us/sample - loss: 0.9240 - accuracy: 0.6899 - val_loss: 0.6467 - val_accuracy: 0.7802
Epoch 2/10
55000/55000 [==============================] - 3s 63us/sample - loss: 0.5935 - accuracy: 0.7941 - val_loss: 0.5394 - val_accuracy: 0.8146
Epoch 3/10
55000/55000 [==============================] - 3s 64us/sample - loss: 0.5202 - accuracy: 0.8170 - val_loss: 0.4891 - val_accuracy: 0.8310
Epoch 4/10
55000/55000 [==============================] - 3s 63us/sample - loss: 0.4811 - accuracy: 0.8304 - val_loss: 0.4669 - val_accuracy: 0.8382
Epoch 5/10
55000/55000 [==============================] - 4s 64us/sample - loss: 0.4558 - accuracy: 0.8385 - val_loss: 0.4417 - val_accuracy: 0.8486
Epoch 6/10
55000/55000 [==============================] - 4s 64us/sample - loss: 0.4375 - accuracy: 0.8444 - val_loss: 0.4285 - val_accuracy: 0.8546
Epoch 7/10
55000/55000 [==============================] - 4s 64us/sample - loss: 0.4234 - accuracy: 0.8501 - val_loss: 0.4178 - val_accuracy: 0.8556
Epoch 8/10
55000/55000 [==============================] - 4s 64us/sample - loss: 0.4116 - accuracy: 0.8540 - val_loss: 0.4094 - val_accuracy: 0.8576
Epoch 9/10
55000/55000 [==============================] - 4s 65us/sample - loss: 0.4018 - accuracy: 0.8578 - val_loss: 0.4007 - val_accuracy: 0.8614
Epoch 10/10
55000/55000 [==============================] - 4s 64us/sample - loss: 0.3931 - accuracy: 0.8609 - val_loss: 0.3955 - val_accuracy: 0.8598

# Show learn result
def plot_learning_curves(history):
    pd.DataFrame(history.history).plot(figsize = (8,5))
    plt.grid(True)
    plt.gca().set_ylim(0,1)
    plt.show()
plot_learning_curves(history)

# test
model.evaluate(x_test_scaled,y_test)

10000/10000 [==============================] - 0s 40us/sample - loss: 0.4323 - accuracy: 0.8447





[0.4322594210624695, 0.8447]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

杭州的 IT 崩盤了麼？

開源高性能結構化日誌模塊NanoLog

Python 潮流週刊#55：分享 9 個高質量的技術類信息源！

Azure Virtual Network (22) 多訂閱使用Azure DNS解析問題 Windows Azure Platform 系列文章目錄

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

基礎前端

TF2-HyperparameterSearch-2

商品名稱一級分類-CNN and RNN 方法測試

讀書筆記-統計學習方法（李航）第一章

讀書筆記-統計學習方法（李航）第四章

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結