神經網絡基礎--指數加權移動平均ewma

原創

2020-06-24 11:02

因爲神經網絡中的常用優化算法都會涉及到指數加權移動平均（exponential weighted moving average， ewma；也可稱爲exponential moving average，ema），所以這裏單獨寫下這個知識點。

ewma通過將歷史的值和當前實際值進行加權求和來得到當前值的估計，常用於減小序列數據的噪聲，其公式如下

$\tilde{x}_t = \beta \tilde{x}_{t-1} + (1-\beta)x_t, \;\; 0 < \beta < 1$ ，將該式進行遞推展開得：

$\tilde{x}_t = \beta (\beta \tilde{x}_{t-2} + (1-\beta)x_{t-1}) + (1-\beta)x_t \\ = \beta^2 \tilde{x}_{t-2} +(1-\beta) \beta {x}_{t-1} + (1-\beta)x_t \\ = \beta^3 \tilde{x}_{t-3} +(1-\beta) \beta^2 {x}_{t-2} +(1-\beta) \beta {x}_{t-1} + (1-\beta)x_t \\ =... \\ = \beta^t \tilde{x}_0 + (1-\beta) \beta^{t-1}{x}_{1} + ... + (1-\beta) \beta^{t-i} {x}_{i} + ... + (1-\beta)\beta^0 x_t$

令初始估計值 $\tilde{x}_0 = 0$ ，則 $\tilde{x}_t =(1-\beta)\sum_{i=1}^{t}{\beta^{t-i}x_i}$

可以看到，歷史值隨着時間距離越大而被賦予越小的權重；具體來說，歷史數據的影響（權重）是隨時間距離變化而呈指數衰減的，也即越久遠的數據對當前估計的影響越小，而這也很符合直覺；當 $\beta$ 越大，對歷史的遺忘越慢，估計值也越平滑；反之，對歷史的遺忘越快，估計值也越貼近實際值。

另外可以看到，在數據估計的初期，由於沒有足夠的歷史數據，估計值往往跟實際值偏差很大；如果對初期的估計值要求比較高的話，則需要對估計值進行偏差修正，

修正公式： $\tilde{x}_t /=(1-\beta^t)$

由於希望估計值的期望跟實際值的期望相當，根據ewma公式，可以得出估計值的期望

$E[\tilde{x}_t] =E[(1-\beta)\sum_{i=1}^{t}{\beta^{t-i}x_i}] \\ = E[x_t](1-\beta)\sum_{i=1}^{t}{\beta^{t-i}} + \zeta \\ = E[x_t](1-\beta^t) + \zeta$

當是x是平穩信號時， $\zeta = 0$ ；否則應該選擇較小的 $\beta$ ，來使 $\zeta$ 接近0

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

神經網絡基礎--循環神經網絡RNN

在處理序列問題（如語言識別等）上，使用循環神經網絡（Recurrent Neural Networks，RNN）是很自然的方式；所謂循環神經網絡，其實就是把上一時刻的信息作爲當前時刻輸入的一部分，從而實現信息的傳遞；本文將先介紹基礎版RN

2020-07-06 21:23:20

神經網絡基礎3：優化方法

本篇主要講神經網絡的常見優化方法。目前，出現了很多優化方法，如SGD、AdaGrad、RMSProp、AdaDelta、Momentum、Nesterov-Momentum (Nesterov’s accelerated gradien

2020-07-06 21:23:20

MobileNet 訓練檢測網實驗總結

MobileNet 訓練檢測網實驗總結 MobileNet做目標檢測的包在tensorflow/models/object_detection裏。先下載一個ssd_mobilenet_v1的預訓練模型。 1.數據製作準備VOC

burning_keyboard

2020-06-27 02:20:16

讀取修改caffemodel文件裏的網絡模型參數

[背景] 老師要我和學長實現一個多分辨率的檢測網。想法是在pvanet的基礎上，從conv2-3生出一個分支子網絡，分支網的rpn和fc還有分類器都是照搬pvanet主幹網。用淺層特徵去檢測小目標，也就是單獨用小目標訓練分支網絡

burning_keyboard

2020-06-27 02:20:16

pvanet訓練並檢測自己的數據_流程_報錯_總結

1.訓練數據的準備 VOC2007數據格式，和faster-rcnn數據一樣，數據集組織結構和製作參見： [訓練樣本製作](http://blog.csdn.net/burning_keyboard/article/details

burning_keyboard

2020-06-27 02:20:15

吳恩達給你的人工智能第一課學習筆記一神經網絡基礎

2020-06-04 04:43:37

神經網絡基礎2：激活函數

2020-05-25 14:14:41

神經網絡基礎1：數據處理biasing與scaling

2020-05-20 13:04:05

深入理解激活函數

2020-02-25 09:43:26

yolo訓練自己的數據實踐總結

burning_keyboard

2020-02-23 15:06:40

pvanet訓練網絡時的一些小技巧

burning_keyboard

2020-02-23 15:06:40

MobileNet訓練分類網

burning_keyboard

2020-02-23 15:06:40

神經網絡訓練樣本製作_VOC格式_FOR_YOLO(Darknet)_AND_PVANet(FasterRCNN)

burning_keyboard

2020-02-23 15:06:40

yolo1,yolo2論文理論總結

burning_keyboard

2020-02-23 15:06:40

神經網絡基礎--循環神經網絡RNN

在處理序列問題（如語言識別等）上，使用循環神經網絡（Recurrent Neural Networks，RNN）是很自然的方式；所謂循環神經網絡，其實就是把上一時刻的信息作爲當前時刻輸入的一部分，從而實現信息的傳遞；本文將先介紹基礎版RN

2020-07-06 21:23:20

24小時熱門文章

最新文章

最新評論文章