（Tensorflow之六）滑動平均模型ExponentialMovingAverage

原創

2020-06-19 11:16

1、計算方法

設{a1,a2,a3,...,an} ,其衰減率爲decay ,對應的影子變量爲：
{m1,m2,m3,...,mn} ,則：

m n = d e c a y * m n - 1 + (1 - d e c a y) * a n

可以展開來分析：

m 1 = a 1

m 2 = d e c a y * a 1 + (1 - d e c a y) * a 2

m 3 = d e c a y * m 2 + (1 - d e c a y) * a 3 = d e c a y 2 * a 1 + (1 - d e c a y) * d e c a y * a 2 + (1 - d e c a y) * a 3

m 4 = d e c a y * m 3 + (1 - d e c a y) * a 4 = d e c a y 3 * a 1 + (1 - d e c a y) * d e c a y 2 * a 2 + (1 - d e c a y) * d e c a y * a 3 + (1 - d e c a y) * a 4

. . . . . .

以其類推

m n = d e c a y * m n - 1 + (1 - d e c a y) * a n = d e c a y n - 1 * a 1 + d e c a y n - 2 * (1 - d e c a y) + . . . + (1 - d e c a y) * a n

一般而言，爲了使模型趨於收斂，會選擇decay爲接近1的數，例如：
decay = 0.99;
那麼：

m 1 = a 1

m 2 = 0.99 * a 1 + 0.01 * a 2

m 3 = 0.99 * m 2 + 0.01 * a 3 = 0.99 2 * a 1 + 0.01 * 0.99 * a 2 + 0.01 * a 3

我們發現初始值對後面影響非常大，若初始值與真實值偏差較大時，函數收斂速度非常慢；爲了解決該問題，tensorflow提供了num_updates參數來動態設置decay的大小；

decay=min{DECAY,1+num_updates10+num_updates}

例：
DECAY = 0.99
第一輪，先設num_updates = 0;
那麼：

d e c a y = m i n {0.99, 1 + 0 10 + 0} = 0.1

則：

m 1 = a 1

m 2 = 0.1 * a 1 + 0.9 * a 2

第二輪，可設num_updates = 100
那麼：

d e c a y = m i n {0.99, 1 + 101 10 + 100} = 0.91

則：

m 3 = 0.91 * m 2 + 0.09 * a 3

以此類推，從而可以動態調整decay值大小。

import tensorflow as tf

test1 = tf.Variable(0,dtype=tf.float32)
num_updates = tf.Variable(0,dtype=tf.float32)
DECAY = 0.99

Moving_average = tf.train.ExponentialMovingAverage(DECAY,num_updates)

#跟新test1
Moving_average_op = Moving_average.apply([test1])

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    #第一次打印出初始值，滑動平均值,輸出值應該爲[0，0]
    print(sess.run([test1,Moving_average.average(test1)]))

    #更新test1
    sess.run(tf.assign(test1,3))
    sess.run(Moving_average_op)
    #第二次打印初始值，滑動平均值,輸出值應該爲[3，0],滑動平均值計算0*0.1+0.9*3=2.7
    print(sess.run([test1,Moving_average.average(test1)]))

    #更新test2與num_updates
    sess.run(tf.assign(test1,5))
    sess.run(tf.assign(num_updates,90))
    sess.run(Moving_average_op)
    #第三次打印初始值，滑動平均值,輸出值應該爲[3，0],滑動平均值計算2.7*0.91+5*0.09
    print(sess.run([test1,Moving_average.average(test1)]))

輸出值

[0.0, 0.0]
[3.0, 2.6999998]
[5.0, 2.9069998]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

（Tensorflow之六）滑動平均模型ExponentialMovingAverage

1、計算方法

AI 畫圖真刺激，手把手教你如何用 ComfyUI 來畫出刺激的圖

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

數據展示動態（跑分）顯示

公衆號5月C#/.NET熱文一覽

git 下載大陸鏡像地址

（Tensorflow之七）L1_regularizer與L2_regularizer正則化

（Tensorflow之八）MNIST數字識別源碼--實戰Google深度學習框架5.2小節

（Tensorflow之三)神經網絡程序一

（VS2017+OPENCV3.3.1）人臉檢測，detectMultiScale內存泄漏處理方法

（Tensorflow之四）激活函數、交叉熵及優化器

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結