視頻學習
爲什麼有些小樣本數據集可以用很小的minibatch,好像有16,8的?
感覺就是平均的規則太“死板”,所以弄個加權。而普通加權又是另一種“死板”,所以用前面的所有“平均”代表當前數。之所以“指數”,是因爲,按公式一層層套進去之後,其實就是一個和貝塔有關的指數。
同理,普通梯度下降,梯度更新也太“死板”,所以借用指數加權平均思想,來更新梯度。(視頻有個球滾下碗的比喻,貝塔比喻摩擦,微分比喻加速度,所以“速度不會無止盡增加。不太理解)
視頻學習
爲什麼有些小樣本數據集可以用很小的minibatch,好像有16,8的?
感覺就是平均的規則太“死板”,所以弄個加權。而普通加權又是另一種“死板”,所以用前面的所有“平均”代表當前數。之所以“指數”,是因爲,按公式一層層套進去之後,其實就是一個和貝塔有關的指數。
同理,普通梯度下降,梯度更新也太“死板”,所以借用指數加權平均思想,來更新梯度。(視頻有個球滾下碗的比喻,貝塔比喻摩擦,微分比喻加速度,所以“速度不會無止盡增加。不太理解)
UI設計點兒3D效果,切圖片後給前端用,前端按照圖片做出靜態效果,結果項目上不滿意。沒錯是我太菜了,菜的一批。 心裏已經燃起學習three.js的慾望。
說明: 以下介紹示例的MCU地址空間如下: ROM空間爲:0x0000 0000 – 0x0000 8000 RAM空間爲:0x2000 0000 – 0x2000 2000