BN實驗計劃

BN實驗計劃

原創

2020-03-02 14:00

對原始的BN來說，
$\overrightarrow{y}=\frac{\overrightarrow{x}-\mu}{\sigma}$
$\frac{\partial L}{\partial \overrightarrow{x}}=\frac{1}{\sigma}[\frac{\partial L}{\partial \overrightarrow{y}}-\frac{(\frac{\partial L}{\partial \overrightarrow{y}},\overrightarrow{1})}{N}\overrightarrow{1}- \frac{(\frac{\partial L}{\partial \overrightarrow{y}},\overrightarrow{y})}{N}\overrightarrow{y}]$
爲方便表示，令：
$g_B=\frac{(\frac{\partial L}{\partial \overrightarrow{y}},\overrightarrow{1})}{N}\overrightarrow{1},\psi_B=\frac{(\frac{\partial L}{\partial \overrightarrow{y}},\overrightarrow{y})}{N}\overrightarrow{y}$
我們現在的猜想，可以分爲以下幾點：

$\sigma$ 的重要性更多的體現在自身的數值上，只要數值近似等於方差即可，可以利用這個數值來對該層的輸出和導數做一個大小上的規範，所以可以採用多種方式來進行計算。而其對應的導數 $\psi_B$ 就沒那麼重要。
均值方面的信息比較少。但是根據MABN在valina BN上的實驗結果，在對均值方差做EMA，對 $g_B,\psi_B$ 做SMA的情況下，完全不收斂。再結合猜想1，大膽假設問題是出在均值的導數上 $g_B$

結合這兩點假設，要做以下實驗驗證猜想：

統計 $\frac{\partial L}{\partial \overrightarrow{y}},g_B,\psi_B，\frac{\partial L}{\partial \overrightarrow{x}}$ ，畫圖，看他們的分佈。
在valina BN上，去掉 $\psi_B$ ，看實驗結果。畫圖，看 $\frac{\partial L}{\partial \overrightarrow{y}},g_B,\psi_B，\frac{\partial L}{\partial \overrightarrow{x}}$ 的分佈
將MABN的方法用在valina BN上，但是對 $g_B$ 不做處理，看實驗結果是否能收斂；
將MABN的方法用在valina BN上，但是對 $\psi_B$ 不做處理，看實驗結果是否能收斂；

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

開題內容

detach_channel_max試驗記錄

The Lottery Ticket Hypothesis

FRN提升方法

目前做法整理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結