神經網絡的前向傳播過程在計算中表示爲矩陣相乘的過程
具體內容在書上3.4.2
實現神經網絡的前向傳播過程
輸入層兩個節點,隱藏層3個,輸出層一個
# 聲明w1,w2兩個變量,通過seed參數設定隨機種子,保證每次運行結果一樣
# stddev=1 表示隨機數標準差爲一
w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))
# 將輸入的特徵向量定義爲一個常量。注意是1x2矩陣
x = tf.constant([[0.7, 0.9]])
##前向傳播算法
a=tf.matmul(x,w1) #得到1x3
y=tf.matmul(a,w2)
with tf.Session() as sess:
#進行w1,w2的初始化
sess.run(w1.initializer)
sess.run(w2.initializer)
print(sess.run(y))
在以上代碼實例中,直接調用了w1,w2的初始化過程,但是如果變量數目很多,或者變量之間存在依賴關係,顯然單個調用的方案就太麻煩了。要使用以下初始化方法
sess.run(tf.global_variables_initializer())
##上面的代碼在會話中表示爲
with tf.Session() as sess:
#進行w1,w2的初始化
sess.run(tf.global_variables_initializer())
print(sess.run(y))
placeholder的使用
相當於定義了一個位置,這個位置中的數據在程序運行時再指定。在定義時,這個位置上的數據類型是需要指定的,而維度信息不一定要給出。
下面給出通過placeholder實現前向傳播算法的代碼
import tensorflow as tf
# 聲明w1,w2兩個變量,通過seed參數設定隨機種子,保證每次運行結果一樣
# stddev=1 表示隨機數標準差爲一
w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))
# 將輸入的特徵向量
# 定義一個placeholder位置
x = tf.placeholder(tf.float32)
##前向傳播算法
a=tf.matmul(x,w1) #得到1x3
y=tf.matmul(a,w2)
with tf.Session() as sess:
#進行w1,w2的初始化
sess.run(tf.global_variables_initializer())##global意思爲整體的
#sess.run(w1.initializer)
#sess.run(w2.initializer)
print(sess.run(y,feed_dict={x:[[0.7,0.9]]}))
feed_dict是一個map,需要給出每個用到的placeholder的取值,如果沒有就會報錯
在訓練神經網絡時需要每次提供一個batch的訓練樣例,placeholder也可以很好的支持
將輸入的1x2矩陣改爲n x 2矩陣,就可以了。這樣前向傳播的結果就爲n x 1,每一行代表一個結果。
代碼中並沒有表明矩陣的大小,以爲placeholder可以根據輸入的數據維度自動計算。與上個代碼區別只在於feed的數據維度不同。
import tensorflow as tf
# 聲明w1,w2兩個變量,通過seed參數設定隨機種子,保證每次運行結果一樣
# stddev=1 表示隨機數標準差爲一
w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))
# 將輸入的特徵向量
# 定義一個placeholder位置
x = tf.placeholder(tf.float32)
##前向傳播算法
a=tf.matmul(x,w1) #得到1x3
y=tf.matmul(a,w2)
with tf.Session() as sess:
#進行w1,w2的初始化
sess.run(tf.global_variables_initializer())##global意思爲整體的
#sess.run(w1.initializer)
#sess.run(w2.initializer)
print(sess.run(y,feed_dict={x:[[0.7,0.9],[0.1,0.4],[0.5,0.8]]}))
簡單的損失函數
作用:在得到一個batch的前向傳播結果後,需要定義一個損失函數來刻畫預測值和真實答案之間的差距,然後再通過反向傳播算法來調整神經網絡參數。
y_代表真值
# sigmoid函數將y轉換爲0-1之間的數值。轉換後y代表預測是正樣本概率,1-y代表負樣本概率
y = tf.sigmoid(y)
# 定義損失函數刻畫預測值與真實值的差距,交叉熵
cross_entropy = -tf.reduce_mean(
y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
+ (1 - y_) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
# 學習率
learning_rate = 0.001
# 定義反向傳播算法來優化神經網絡中的參數
train_step = \
tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)
完整神經網絡樣例程序
import tensorflow as tf
from numpy.random import RandomState
batch_size = 8
w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))
# 在shape的一個維度上使用None可以方便使用不同的batch大小。
x = tf.placeholder(tf.float32, shape=(None, 2), name="x-input")
y_ = tf.placeholder(tf.float32, shape=(None, 1), name="y-input")
# 神經網絡的前向傳播
a = tf.matmul(x, w1) # 得到1x3
y = tf.matmul(a, w2)
# 定義損失函數和反向傳播算法
# sigmoid函數將y轉換爲0-1之間的數值。轉換後y代表預測是正樣本概率,1-y代表負樣本概率
y = tf.sigmoid(y)
# 定義損失函數刻畫預測值與真實值的差距,交叉熵
#通過tf.clip_by_value可以將一個張量中的數值限制在一個範圍之內,可以避免一些運算錯誤,比如log0是
#無效的,但是這裏的非線性函數是sigmoid也無所謂,不會出現0
cross_entropy = -tf.reduce_mean(
y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
+ (1 - y_) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
learning_rate = 0.001
train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)
# 通過隨機數生成一個模擬數據集
rdm = RandomState(1) # 1爲隨機種子seed,只要隨機種子seed相同,產生的隨機數序列就相同
dataset_size = 128
X = rdm.rand(dataset_size, 2)
#x1+x2<1爲1,否則爲0
Y = [[int(x1 + x2 < 1)] for (x1, x2) in X]
with tf.Session() as sess:
# 變量的初始化
sess.run(tf.global_variables_initializer()) ##global意思爲整體的
# 訓練之前的神經網絡參數的值
print(sess.run(w1))
print(sess.run(w2))
# 設定訓練的輪數
STEPS = 5000
for i in range(STEPS):
start = (i * batch_size) % dataset_size
end = min(start + batch_size, dataset_size)
sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
if i % 1000 == 0:
total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
print("%d STEP ,cross entropy on all data is %g"% (i, total_cross_entropy))