構建簡單網絡和優化方法—手寫數字識別

文章目錄

構建簡單網絡和優化方法—手寫數字識別

4.使用優化器AdamOptimizer，減小學習率的變化速度

1,如何構建初始的“手寫數字識別”神經網絡？

1.下載MNIST_data集並把該數據集放在源.py/.ipynb文件的相同路徑位置，並載入數據集。

2.自定義batch_size(每個批次讀取圖片的數量大小)，並計算n_batch(總共的批次數)。

3.定義x和y，使用feed方法進行數據輸入。

4.創建一個簡單的神經網絡，輸入層爲784個神經元，輸出層爲10個神將元。(需要注意的是：激活函數使用softmax(),用於將計算結果進行概率轉換。)

5.損失函數使用二次代價函數，loss = tf.reduce_mean(tf.square(y-prediction))。

6.優化器使用梯度下降法，train_step = tf.train.GradientDescentOptimizer(xx).minimize(loss)。

7.結果存放在一個布爾型列表中，correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))#argmax返回一維張量中最大的值所在的位置。

8.定義準確率，accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))。

9使用默認圖tensorflow.Session()進行訓練並調用測試。（需要注意的地方：sess.run(train_step)使用的是train集，而sess.run(accuracy)使用的是test集。）

2，如何進行簡單網絡的優化？

1.對w，b的初始值進行優化。

W = tf.Variable(tf.truncated_normal([784, 3000], stddev=0.1))
b = tf.Variable(tf.zeros([3000])+0.1)

2.使用交叉熵函數作爲損失函數。

#交叉熵函數
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=y, logits=prediction))

需要注意的是：

在Tensorflow中用： tf.nn.softmax_cross_entropy_with_logits()來表示跟softmax搭配使用的交叉熵。

3.添加多箇中間層，同時使用Dropout()防止過擬合發生。

#創建神經網絡的中間層1
W1 = tf.Variable(tf.truncated_normal([784, 500], stddev=0.1))
b1 = tf.Variable(tf.zeros([500])+0.1)
predict1 = tf.nn.tanh(tf.matmul(x, W1)+b1)
drop_1 = tf.nn.dropout(predict1, keep_prob)
#創建神經網絡的中間層2
W2 = tf.Variable(tf.truncated_normal([500, 300], stddev=0.1))
b2 = tf.Variable(tf.zeros([300])+0.1)
predict2 = tf.nn.tanh(tf.matmul(drop_1, W2)+b2)
drop_2 = tf.nn.dropout(predict2, keep_prob)
#創建神經網絡的輸出層
W3 = tf.Variable(tf.truncated_normal([300, 10], stddev=0.1))
b3 = tf.Variable(tf.zeros([10])+0.1)
prediction = tf.nn.softmax(tf.matmul(drop_2, W3)+b3)

注：keep_prob爲隨機抽取同一層神經元的比例，神經元個數控制在數據集相近。

4.使用優化器AdamOptimizer，減小學習率的變化速度

#定義變量學習率lr，初始化爲0.001
lr = tf.Variable(0.001, dtype=tf.float32)
#使用AdamOptimizer優化器
train_step = tf.train.AdamOptimizer(lr).minimize(loss)
#在迭代中設置學習率變化幅度
sess.run(tf.assign(lr, 0.001*(0.95**epoch)))

本題採用以上4種優化方法後優化效果較好。

優化後的測試結果：

附：優化前的簡單網絡的構建代碼—手寫字體識別：


#載入數據集
mnist = input_data.read_data_sets("MNIST_data",one_hot=True)

#每個批次的大小
batch_size = 100
#計算一共有多少個批次
n_batch = mnist.train.num_examples // batch_size

#定義兩個placeholder
x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])

#創建一個簡單的神經網絡
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
prediction = tf.nn.softmax(tf.matmul(x,W)+b)

#二次代價函數
loss = tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step = tf.train.GradientDescentOptimizer(0.2).minimize(loss)

#初始化變量
init = tf.global_variables_initializer()

#結果存放在一個布爾型列表中
correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))#argmax返回一維張量中最大的值所在的位置
#求準確率
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

with tf.Session() as sess:
    sess.run(init)
    for epoch in range(21):
        for batch in range(n_batch):
            batch_xs,batch_ys =  mnist.train.next_batch(batch_size)
            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})
        
        acc = sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
        print("Iter " + str(epoch) + ",Testing Accuracy " + str(acc))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

構建簡單網絡和優化方法—手寫數字識別

構建簡單網絡和優化方法—手寫數字識別

文章目錄

1,如何構建初始的“手寫數字識別”神經網絡？

2，如何進行簡單網絡的優化？

1.對w，b的初始值進行優化。

2.使用交叉熵函數作爲損失函數。

3.添加多箇中間層，同時使用Dropout()防止過擬合發生。

4.使用優化器AdamOptimizer，減小學習率的變化速度

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

數值分析案例：Newton插值預測2019城市(Asian)溫度、Crout求解城市等溫性的因素係數

置換矩陣與轉置矩陣之間的聯繫

TensorFlow如何保存和載入神經網絡模型？

Matlab:圖像平移算法的原理實現，缺陷分析及優化

決策樹與隨機森林講解

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結