Tensorflow學習(2)-實現神經網絡

神經網絡的前向傳播過程在計算中表示爲矩陣相乘的過程

具體內容在書上3.4.2

實現神經網絡的前向傳播過程

輸入層兩個節點,隱藏層3個,輸出層一個

# 聲明w1,w2兩個變量,通過seed參數設定隨機種子,保證每次運行結果一樣
# stddev=1 表示隨機數標準差爲一
w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))

# 將輸入的特徵向量定義爲一個常量。注意是1x2矩陣
x = tf.constant([[0.7, 0.9]])

##前向傳播算法
a=tf.matmul(x,w1) #得到1x3
y=tf.matmul(a,w2)

with tf.Session() as sess:
    #進行w1,w2的初始化
    sess.run(w1.initializer)
    sess.run(w2.initializer)
    print(sess.run(y))

在以上代碼實例中,直接調用了w1,w2的初始化過程,但是如果變量數目很多,或者變量之間存在依賴關係,顯然單個調用的方案就太麻煩了。要使用以下初始化方法

sess.run(tf.global_variables_initializer())


##上面的代碼在會話中表示爲
with tf.Session() as sess:
    #進行w1,w2的初始化
    sess.run(tf.global_variables_initializer())
    print(sess.run(y))

placeholder的使用

相當於定義了一個位置,這個位置中的數據在程序運行時再指定。在定義時,這個位置上的數據類型是需要指定的,而維度信息不一定要給出。

下面給出通過placeholder實現前向傳播算法的代碼

import tensorflow as tf

# 聲明w1,w2兩個變量,通過seed參數設定隨機種子,保證每次運行結果一樣
# stddev=1 表示隨機數標準差爲一
w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))

# 將輸入的特徵向量
# 定義一個placeholder位置
x = tf.placeholder(tf.float32)
##前向傳播算法
a=tf.matmul(x,w1) #得到1x3
y=tf.matmul(a,w2)

with tf.Session() as sess:
    #進行w1,w2的初始化
    sess.run(tf.global_variables_initializer())##global意思爲整體的
    #sess.run(w1.initializer)
    #sess.run(w2.initializer)
    print(sess.run(y,feed_dict={x:[[0.7,0.9]]}))

feed_dict是一個map,需要給出每個用到的placeholder的取值,如果沒有就會報錯

在訓練神經網絡時需要每次提供一個batch的訓練樣例,placeholder也可以很好的支持

將輸入的1x2矩陣改爲n x 2矩陣,就可以了。這樣前向傳播的結果就爲n x 1,每一行代表一個結果。

代碼中並沒有表明矩陣的大小,以爲placeholder可以根據輸入的數據維度自動計算。與上個代碼區別只在於feed的數據維度不同。

import tensorflow as tf

# 聲明w1,w2兩個變量,通過seed參數設定隨機種子,保證每次運行結果一樣
# stddev=1 表示隨機數標準差爲一
w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))

# 將輸入的特徵向量
# 定義一個placeholder位置
x = tf.placeholder(tf.float32)
##前向傳播算法
a=tf.matmul(x,w1) #得到1x3
y=tf.matmul(a,w2)

with tf.Session() as sess:
    #進行w1,w2的初始化
    sess.run(tf.global_variables_initializer())##global意思爲整體的
    #sess.run(w1.initializer)
    #sess.run(w2.initializer)
    print(sess.run(y,feed_dict={x:[[0.7,0.9],[0.1,0.4],[0.5,0.8]]}))

簡單的損失函數

作用:在得到一個batch的前向傳播結果後,需要定義一個損失函數來刻畫預測值和真實答案之間的差距,然後再通過反向傳播算法來調整神經網絡參數。

y_代表真值

# sigmoid函數將y轉換爲0-1之間的數值。轉換後y代表預測是正樣本概率,1-y代表負樣本概率
y = tf.sigmoid(y)
# 定義損失函數刻畫預測值與真實值的差距,交叉熵
cross_entropy = -tf.reduce_mean(
    y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
    + (1 - y_) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
# 學習率
learning_rate = 0.001
# 定義反向傳播算法來優化神經網絡中的參數
train_step = \
    tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)

完整神經網絡樣例程序

import tensorflow as tf
from numpy.random import RandomState

batch_size = 8

w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))

# 在shape的一個維度上使用None可以方便使用不同的batch大小。
x = tf.placeholder(tf.float32, shape=(None, 2), name="x-input")
y_ = tf.placeholder(tf.float32, shape=(None, 1), name="y-input")

# 神經網絡的前向傳播
a = tf.matmul(x, w1)  # 得到1x3
y = tf.matmul(a, w2)

# 定義損失函數和反向傳播算法

# sigmoid函數將y轉換爲0-1之間的數值。轉換後y代表預測是正樣本概率,1-y代表負樣本概率
y = tf.sigmoid(y)
# 定義損失函數刻畫預測值與真實值的差距,交叉熵
#通過tf.clip_by_value可以將一個張量中的數值限制在一個範圍之內,可以避免一些運算錯誤,比如log0是
#無效的,但是這裏的非線性函數是sigmoid也無所謂,不會出現0
cross_entropy = -tf.reduce_mean(
    y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
    + (1 - y_) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
learning_rate = 0.001
train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)

# 通過隨機數生成一個模擬數據集
rdm = RandomState(1)  # 1爲隨機種子seed,只要隨機種子seed相同,產生的隨機數序列就相同
dataset_size = 128
X = rdm.rand(dataset_size, 2)
#x1+x2<1爲1,否則爲0
Y = [[int(x1 + x2 < 1)] for (x1, x2) in X]

with tf.Session() as sess:
    # 變量的初始化
    sess.run(tf.global_variables_initializer())  ##global意思爲整體的

    # 訓練之前的神經網絡參數的值
    print(sess.run(w1))
    print(sess.run(w2))

    # 設定訓練的輪數
    STEPS = 5000
    for i in range(STEPS):
        start = (i * batch_size) % dataset_size
        end = min(start + batch_size, dataset_size)
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
        if i % 1000 == 0:
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
            print("%d STEP ,cross entropy on all data is %g"% (i, total_cross_entropy))

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章