BN實驗總結

原創

许多天的rua

2020-06-26 04:27

利用每個channel下的max 和min計算均值方差

方差	方差係數	均值	resnet-20/cifar-10的錯誤率
$(max-min)^2$	無	$(max-min)/2$	0.28
$(max-min)^2$	$\frac {1} {\sqrt{2*ln(n)}}$ n是該channel下參數個數	$(max-min)/2$	0.24
$(max-min)^2$	$\frac {1} {\sqrt{2*ln(n)}}$	origin_mean	0.18
$max-min$	無	$(max-min)/2$	0.31
$max -min$	$abs(1+\lambda) ，\lambda是可學習參量$	$(max-min)/2$	0.25
$max -min$	$abs(1+\lambda)$	origin_mean	0.19
origin_var	無	origin_mean	0.18

將resnet20中間的一個卷積層的輸出記錄下來，該卷積層的輸出有32個channel。計算輸出的方差real_var和均值real_mean，同時按照上面的估算公式，分別估計方差estimateVar,均值estimateMean。

利用weight的統計值來估計均值和方差

$z = x * w = X_1W_1+X_2W_2+....X_{C_{in}}W_{C_{in}}=C_{in}XW$
$E(z) = C_{in} * \sqrt{\frac{1}{2\pi}}*\mu_w$
$E(z^2)=C_{in}^2*\frac{1}{2}*\sigma^2_{w}$
將resnet20中間的一個卷積層的輸出記錄下來，該卷積層的輸出有32個channel。計算輸出的方差real_var和均值real_mean，同時按照上面的估算公式，分別估計方差estimateVar,均值estimateMean。
下圖是 $varDiff=estimateVar/realVar$ 。

下圖是 $meanDiff=estimateMean/realMean$ 。

由上面兩圖可以看出，對方差的估計是非常靠近真實的方差取值的。而均值的估計則比較差。

均值方差在整個訓練過程中的變化

仍然取該層的輸出，畫出mean和var在整個訓練過程中的變化趨勢

從上面可以看出，隨着訓練過程的推進，各個channel的均值向着0靠近。

從上面的圖看出，隨着訓練過程的推進，各個channel的方差逐漸降低。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

MNN量化源碼詳解

參考鏈接：https://www.zhihu.com/question/337513515 MNN量化工具使用編譯 cd MNN mkdir build cd build cmake -DMNN_BUILD_QUANTO

三寸光阴___

2020-07-08 08:51:38

聚寬平臺——小市值策略實現

# 導入函數庫 from jqdata import * # 初始化函數，設定基準等等 def initialize(context): # 設定滬深300作爲基準 set_benchmark('000002.XSH

2020-07-07 23:09:36

聚寬平臺——雙均線策略實現

import tushare as ts import numpy as np import pandas as pd import matplotlib.pyplot as plt #1.獲取股票代碼爲002400的股票數據 #df

2020-07-07 23:09:36

聚寬平臺——雙因子策略實現

# 導入函數庫 from jqdata import * # 初始化函數，設定基準等等 def initialize(context): # 設定滬深300作爲基準 set_benchmark('000002.XSH

2020-07-07 23:09:36

閒話模型壓縮之量化（Quantization）篇

1. 前言這些年來，深度學習在衆多領域亮眼的表現使其成爲了如今機器學習的主流方向，但其巨大的計算量仍爲人詬病。尤其是近幾年，隨着端設備算力增強，業界湧現出越來越多基於深度神經網絡的智能應用。爲了彌補算力需求與供給的鴻溝，近幾年來

2020-07-07 00:11:09

int8量化學習

量化原理介紹： https://zhuanlan.zhihu.com/p/58182172 https://zhuanlan.zhihu.com/p/58208691 量化小實驗： https://github.com/Ewenw

三寸光阴___

2020-07-05 10:40:42

【S031】盈時策略：PTA策略，年化收益超過120%，盈虧比超過3

關注公衆號：盈時策略盈虧曲線圖策略基本信息策略名稱：YS_TA_15min_S031 (PTA) 日內或隔夜：隔夜數據週期：15min 開倉方式：每次1手，不連續建倉回測時間範圍：2010-01-04 ~ 2020-0

2020-07-04 18:40:37

【S034】盈時策略：甲醇策略，年化收益超過200%,盈虧比2.6

關注公衆號：盈時策略盈虧曲線圖策略基本信息策略名稱：YS_MA_15min_S034 (甲醇) 日內或隔夜：隔夜數據週期：15min 開倉方式：每次1手，不連續建倉回測時間範圍：2014-06-18 ~ 2020-06

2020-07-04 18:40:37

【P002】盈時策略組合：三十萬元資金組合，年均收益近8.6萬元，近一年盈利14.27萬元

關注公衆號：盈時策略組合盈虧曲線圖策略組合基本信息適用資金：25萬元~35萬元大致倉位：30%（10%保證金率）交易標的：滬鋁（3手）、甲醇（9手）、瀝青（6手）、熱卷（6手）策略數量：8 開倉方式：每次固定手數，不

2020-07-04 18:40:37

【S002】盈時策略：白糖策略，年化收益96%，近一年一手盈利超6000元

關注公衆號：盈時策略盈虧曲線圖策略基本信息策略名稱：YS_SR_15min_S002 (白糖) 日內或隔夜：隔夜數據週期：15min 開倉方式：每次1手，不連續建倉回測時間範圍：2010-01-04 ~ 2020-06

2020-07-04 18:40:37

【P001】盈時策略組合：十萬元資金組合，年均收益4.19萬元，近一年盈利5.45萬元

關注公衆號：盈時策略組合盈虧曲線圖策略組合基本信息適用資金：8萬元~12萬元大致倉位：30%（10%保證金率）交易標的：甲醇（4手）、白糖（2手）、滬鎳（1手）策略數量：5 開倉方式：每次固定手數，不連續建倉回測時

2020-07-04 18:40:37

【S001】盈時策略：白糖策略，年化收益91%，近五成勝率盈虧比接近2

關注公衆號：盈時策略盈虧曲線圖策略基本信息策略名稱：YS_SR_15min_S001 (白糖) 日內或隔夜：隔夜數據週期：15min 開倉方式：每次1手，不連續建倉回測時間範圍：2010-01-04 ~ 2020-06

2020-07-04 18:40:37

【P003】盈時策略組合：五十萬元資金組合，年均收益近24萬元，收益風險比3.89

關注公衆號：盈時策略組合盈虧曲線圖策略組合基本信息適用資金：40萬元~60萬元大致倉位：30%（10%保證金率）交易標的：螺紋（5手）、焦炭（1手）、甲醇（10手）、PTA（4手）、豆粕（6手）、白糖（4手）、滬鎳（2

2020-07-04 18:40:37

【P004】盈時策略組合：100萬元資金組合，年均收益30.62萬元，近一年盈利26.71萬元

關注公衆號：盈時策略組合盈虧曲線圖策略組合基本信息適用資金：100萬元大致倉位：30%（10%保證金率）交易標的：螺紋、焦炭、甲醇、PTA、豆粕、白糖、滬鎳等12個品種策略數量：18 開倉方式：每次固定手數，不連續建

2020-07-04 18:40:37

【量化】4天學會python機器學習與量化交易-筆記3(p16~p20)

文章目錄p16 案例：多因子的市值因子選股介紹p17 案例：多因子的市值因子選股演示p18 多因子策略流程、因子數據組成、去極值介紹p19 案例：中位數去極值和3背中位數去極值p20 案例：3sigma法去極值平臺：https:

机智翔学长

2020-07-02 15:02:59

24小時熱門文章

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

最新文章

最新評論文章