01_初識卷積神經網絡

在這裏插入圖片描述

卷積神經網絡意義

對於MNIST數據集來說,採用邏輯迴歸對數據進行辨別似乎已經達到極限,無法通過細枝末節的修補對其準確度做出更進一步的提高,因此本章開始放棄原有模型而採用全新的卷積神經網絡對數據進行處理。對於任意一個卷積網絡來說,幾個必不可少的部分爲:

  1. 輸入層:用以對數據進行輸入
  2. 卷積層:使用給定的核函數對輸入的數據進行特徵提取,並根據核函數的數據產生若干個卷積特徵結果
  3. 池化層:用以對數據進行降維,減少數據的特徵
  4. 全連接層:對數據已有的特徵進行重新提取並輸出結果

案例演示

數據準備

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import time

# 聲明輸入圖片數據,類別
x = tf.placeholder('float', [None, 784])
y_ = tf.placeholder('float', [None, 10])
# 輸入圖片數據轉化
x_image = tf.reshape(x, [-1, 28, 28, 1])

卷積層、池化層

在程序中首先創建兩個卷積層,TensorFlow中將卷積層已經實現並封裝完畢,其他人只需調用即可

filter1 = tf.Variable(tf.truncated_normal([5, 5, 1, 6]))
bias1 = tf.Variable(tf.truncated_normal([6]))
conv1 = tf.nn.conv2d(x_image, filter1, strides=[1, 1, 1, 1], padding='SAME')
h_conv1 = tf.nn.sigmoid(conv1 + bias1)

maxPool2 = tf.nn.max_pool(h_conv1, ksize=[1, 2, 2, 1],strides=[1, 2, 2, 1], padding='SAME')

filter2 = tf.Variable(tf.truncated_normal([5, 5, 6, 16]))
bias2 = tf.Variable(tf.truncated_normal([16]))
conv2 = tf.nn.conv2d(maxPool2, filter2, strides=[1, 1, 1, 1], padding='SAME')
h_conv2 = tf.nn.sigmoid(conv2 + bias2)

maxPool3 = tf.nn.max_pool(h_conv2, ksize=[1, 2, 2, 1],strides=[1, 2, 2, 1], padding='SAME')

filter3 = tf.Variable(tf.truncated_normal([5, 5, 16, 120]))
bias3 = tf.Variable(tf.truncated_normal([120]))
conv3 = tf.nn.conv2d(maxPool3, filter3, strides=[1, 1, 1, 1], padding='SAME')
h_conv3 = tf.nn.sigmoid(conv3 + bias3)

上面代碼段中首先定義了卷積核w_conv,其中的四個參數[5,5,1,32],前兩者參數5,5是卷積核的大小,代表卷積核是一個[5,5]的矩陣所構成,而第三個參數是輸入的數據通道,第四個參數即爲輸出的數據通道(卷積核的個數)
在這裏:ksize=[1, 2, 2, 1]指的是池化矩陣的大小,即使用[2,2]的矩陣,而第三個參數strides=[1, 2, 2, 1]指的是池化層在每一維度上滑動的步長。通過第一個卷積層和池化層,輸入的數據被轉化成[None,7,7,120]的大小的新的數據集,之後再通過一次全連接層對數據進行重新分類

全連接層

# 全連接層
# 權值參數
W_fc1 = tf.Variable(tf.truncated_normal([7 * 7 * 120, 80]))
# 偏置值
b_fc1 = tf.Variable(tf.truncated_normal([80]))
# 將卷積的產出展開
h_pool2_flat = tf.reshape(h_conv3, [-1, 7 * 7 * 120])
# 神經網絡計算,並添加sigmoid激活函數
h_fc1 = tf.nn.sigmoid(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)


# 輸出層,使用softmax進行多分類
W_fc2 = tf.Variable(tf.truncated_normal([80, 10]))
b_fc2 = tf.Variable(tf.truncated_normal([10]))
y_conv = tf.nn.softmax(tf.matmul(h_fc1, W_fc2) + b_fc2)

計算損失值

cross_entropy = -tf.reduce_sum(y_ * tf.log(y_conv))

初始化optimizer

train_step = tf.train.GradientDescentOptimizer(0.001).minimize(cross_entropy)

指定迭代次數,並在session執行graph

sess = tf.InteractiveSession()
# 測試正確率
correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))

# 所有變量進行初始化
sess.run(tf.initialize_all_variables())

# 獲取mnist數據
mnist_data_set = input_data.read_data_sets('MNIST_data', one_hot=True)

# 進行訓練
start_time = time.time()
for i in range(20000):
    # 獲取訓練數據
    batch_xs, batch_ys = mnist_data_set.train.next_batch(200)

    # 每迭代100個 batch,對當前訓練數據進行測試,輸出當前預測準確率
    if i % 100 == 0:
        train_accuracy = accuracy.eval(feed_dict={x: batch_xs, y_: batch_ys})
        print("step %d, training accuracy %g" % (i, train_accuracy))
        # 計算間隔時間
        end_time = time.time()
        print('time: ', (end_time - start_time))
        start_time = end_time
    # 訓練數據
    train_step.run(feed_dict={x: batch_xs, y_: batch_ys})

# 關閉會話
sess.close()

完整代碼如下

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import time

# 聲明輸入圖片數據,類別
x = tf.placeholder('float', [None, 784])
y_ = tf.placeholder('float', [None, 10])
# 輸入圖片數據轉化
x_image = tf.reshape(x, [-1, 28, 28, 1])

#第一層卷積層,初始化卷積核參數、偏置值,該卷積層5*5大小,一個通道,共有6個不同卷積核
filter1 = tf.Variable(tf.truncated_normal([5, 5, 1, 6]))
bias1 = tf.Variable(tf.truncated_normal([6]))
conv1 = tf.nn.conv2d(x_image, filter1, strides=[1, 1, 1, 1], padding='SAME')
h_conv1 = tf.nn.sigmoid(conv1 + bias1)

maxPool2 = tf.nn.max_pool(h_conv1, ksize=[1, 2, 2, 1],strides=[1, 2, 2, 1], padding='SAME')

filter2 = tf.Variable(tf.truncated_normal([5, 5, 6, 16]))
bias2 = tf.Variable(tf.truncated_normal([16]))
conv2 = tf.nn.conv2d(maxPool2, filter2, strides=[1, 1, 1, 1], padding='SAME')
h_conv2 = tf.nn.sigmoid(conv2 + bias2)

maxPool3 = tf.nn.max_pool(h_conv2, ksize=[1, 2, 2, 1],strides=[1, 2, 2, 1], padding='SAME')

filter3 = tf.Variable(tf.truncated_normal([5, 5, 16, 120]))
bias3 = tf.Variable(tf.truncated_normal([120]))
conv3 = tf.nn.conv2d(maxPool3, filter3, strides=[1, 1, 1, 1], padding='SAME')
h_conv3 = tf.nn.sigmoid(conv3 + bias3)



# 全連接層
# 權值參數
W_fc1 = tf.Variable(tf.truncated_normal([7 * 7 * 120, 80]))
# 偏置值
b_fc1 = tf.Variable(tf.truncated_normal([80]))
# 將卷積的產出展開
h_pool2_flat = tf.reshape(h_conv3, [-1, 7 * 7 * 120])
# 神經網絡計算,並添加sigmoid激活函數
h_fc1 = tf.nn.sigmoid(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)


# 輸出層,使用softmax進行多分類
W_fc2 = tf.Variable(tf.truncated_normal([80, 10]))
b_fc2 = tf.Variable(tf.truncated_normal([10]))
y_conv = tf.nn.softmax(tf.matmul(h_fc1, W_fc2) + b_fc2)
# 損失函數
cross_entropy = -tf.reduce_sum(y_ * tf.log(y_conv))
# 使用GDO優化算法來調整參數
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(cross_entropy)

sess = tf.InteractiveSession()
# 測試正確率
correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))

# 所有變量進行初始化
sess.run(tf.initialize_all_variables())

# 獲取mnist數據
mnist_data_set = input_data.read_data_sets('MNIST_data', one_hot=True)

# 進行訓練
start_time = time.time()
for i in range(20000):
    # 獲取訓練數據
    batch_xs, batch_ys = mnist_data_set.train.next_batch(200)

    # 每迭代100個 batch,對當前訓練數據進行測試,輸出當前預測準確率
    if i % 100 == 0:
        train_accuracy = accuracy.eval(feed_dict={x: batch_xs, y_: batch_ys})
        print("step %d, training accuracy %g" % (i, train_accuracy))
        # 計算間隔時間
        end_time = time.time()
        print('time: ', (end_time - start_time))
        start_time = end_time
    # 訓練數據
    train_step.run(feed_dict={x: batch_xs, y_: batch_ys})

# 關閉會話
sess.close()

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章