模型訓練

原創

lshiwjx

2020-02-20 17:00

白化

減均值：使分佈以0爲中心
除以方差：自然圖像本身就是，不用除

BN和dropout

區別聯繫
 BN：論文中提到了四個優點

使用更高的學習率
不用太擔心初始化
像一個正則項，減少dropout的需求，但不矛盾
使更快收斂

實現：weight和bias對應gamma和beta，running mean 和 var對應內部的累計均值和方差，配合momentum在訓練時使用，直接在測試時使用。affine控制是否學習scale和shift，即weight和bias。

GPU設置

設置使用的gpu個數

訓練技巧

val和train的gap，lr。。。

優化方法的選擇

各種方法的比較，推薦adam
簡短版本

Loss

均方差和交叉熵

C = ( y - a ) 2 2

熵和交叉熵：熵就是最優編碼，交叉熵就是用p的最優編碼來編碼q的平均編碼長度。

H (p) = \sum x p (x) log 2 (1 p ( x ))

H p (q) = \sum x q (x) log 2 (1 p ( x ))

Softmax

softmax 層的輸出是一個概率分佈。在許多問題中，我們可以很方便地將輸出激活值看作是神經網絡認爲結果是的概率。

a L j = e z L j \sum k e z L k

lshiwjx

發佈了54 篇原創文章 · 獲贊 11 · 訪問量 2萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

模型訓練

白化

BN和dropout

GPU設置

訓練技巧

優化方法的選擇

Loss

Softmax

985 碩士程序員，空窗 4 個月沒有 Offer！

營銷系統黑名單優化：位圖的應用解析

一文搞懂 Spring 循環依賴

我真的從測試轉成了開發......

nginx添加相應配置，通過瀏覽器訪問或curl時返回客戶端對應公網IP

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

python內置函數——sorted

[oeasy]python020在遊戲中體驗數值自由_勇闖地下城_終端文字遊戲

爲何我建議你學會抄代碼

抖音面試：說說延遲任務的調度算法？

小工具整理

cmake使用conda環境裏的包

沒有root安裝apt-get包

設置服務器免密登陸並修改用戶名字

git 刪除已經跟蹤的文件

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結