【Pytorch】tensor初始化方法

原創

2020-06-22 20:48

1. 導入常用初始化方法

from torch.nn.init import xavier_uniform_, xavier_normal_
from torch.nn.init import kaiming_uniform_, kaiming_normal_

2. 各種初始化方法分析

xavier_uniform_(tensor, gain=1.0)

Note: 以均勻分佈的值初始化輸入tensor. 方法根據《Understanding the difficulty of training deep feedforward neural networks - Glorot, X. & Bengio, Y. (2010)》論文實現。最終得到的Tesor值取樣於U(−a,a) ，

其中： $a = gain \ast \sqrt{6 \div fanin + fanout}$ \

參數：

gain: 縮放因素(optional)

xavier_normal_(tensor, gain=1.0)

Note: 以正太分佈的值初始化輸入tensor. 方法根據《Understanding the difficulty of training deep feedforward neural networks - Glorot, X. & Bengio, Y. (2010)》論文實現。最終得到的Tesor值取樣於 $N(0, std^{2})$ ,

其中： $std = gain \ast \sqrt{2 \div fanin + fanout}$

kaiming_uniform_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')

Note: 以均勻分佈的值初始化輸入tensor. 方法根據《Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification - He, K. et al. (2015)》論文實現。最終得到的Tesor值取樣於U(−bound,bound) ，

其中： $bound = \sqrt{6 \div (1 + a^{2}) * fanin}$

參數：a:

mode: "fan_in" 或 "fan_out". 選擇“fan_in" 在前向傳播中保存權重方差的幅度， ”fan_out" 在後向傳播中保存幅度。

nonlinearity: 非線性函數。推薦"relu" or "leaky_relu".

kaiming_normal_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')

Note: 以正太分佈的值初始化輸入tensor. 方法根據《Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification - He, K. et al. (2015)》論文實現。最終得到的Tesor值取樣於 $N(0, std^{2})$ ，

其中： $std = \sqrt{2 \div fanin × (1 + a^{2})}$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pytorch 中的梯度計算

最近對pytorch的梯度計算產生了一點興趣，然後現在就總結一下，我看到的幾篇講得挺好的博客。創建帶有grad的tensor input = torch.tensor([1., 2., 3., 4.,], requires_gr

永远的小白虾

2020-07-07 15:03:38

Pytorch批量數據讀取方法詳解: DataLoader

在訓練模型的過程中，我們需要不斷的讀取小批量的數據樣本。Pytorch提供了data包來讀取數據。接下來我將人工生成一些數據，然後使用data包來處理數據。 import torch import numpy as np '''

2020-07-08 04:10:07

subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: java: java

在運行coco計算ImageCaption得分時，出現以下錯誤： subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: 'java': 'java' 原因：

清晨的光明

2020-07-08 02:37:26

Pytorch知識點與問題解決

文|Seraph 01 | 知識點 torcht.is_tensor(a) 判斷是否爲張量 Pytorch GPU環境是否正常測試代碼： import torch flag = torch.cuda.is_available(

2020-07-08 00:56:51

Pytorch: dataloader的一些使用心得

Pytorch: Dataloader的一些使用心得這篇博文不講原理，只講一些使用方法和技巧。所有提供的信息僅供參考，不要當作金科玉律。文章目錄Pytorch: Dataloader的一些使用心得基本程序框架從datalo

2020-07-07 23:40:48

Pytorch|YOWO原理及代碼詳解(二)

Pytorch|YOWO原理及代碼詳解(二) 本博客上接，Pytorch|YOWO原理及代碼詳解(一)，閱前可看。 1.正式訓練 if opt.evaluate: logging('evaluating .

2020-07-07 23:39:48

Pytorch|YOWO原理及代碼詳解(三)

Pytorch|YOWO原理及代碼詳解(三) 本博客上接， Pytorch|YOWO原理及代碼詳解(一)， Pytorch|YOWO原理及代碼詳解(二)，閱前可看。 1. test分析 if opt.evaluate:

2020-07-07 23:39:48

Pytorch|YOWO原理及代碼詳解(一)

Pytorch|YOWO原理及代碼詳解（一）閱前可看：YOWO論文翻譯 YOWO很有趣，使用價值很大，最近剛好需要，所以就研究一下。一直認爲只有把源碼看懂，才知道諸多細節，纔算真正瞭解一個算法。筆者能力有限，博文若有出錯，歡迎指

2020-07-07 23:39:37

Pytorch顯存問題

運行出現錯誤： RuntimeError: CUDA out of memory. Tried to allocate 500.00 MiB (GPU 0; 4.00 GiB total capacity; 204.39 MiB

2020-07-07 17:46:09

Kaggle手寫數字識別（Digit Recognizer）記錄

競賽地址 https://www.kaggle.com/c/digit-recognizer 苦於學了cs231n和pytorch之後沒有東西拿來練手，就去kaggle上找了一個入門競賽，MNIST手寫數字識別，這個比賽把MN

不跑步就等肥

2020-07-07 15:12:31

Pytorch搭建神經網絡基本步驟（文末附pytorch實現AlexNet）

文章參考: http://pytorch123.com/SecondSection/neural_networks/ cs231n assignment2 - http://cs231n.github.io/assignment

不跑步就等肥

2020-07-07 15:12:31

強化學習--Pytorch--DQN擴展以及Policy Gradient網絡結構

DQN改進 DQN算法存在過估計問題，可以採用Double DQN方法來進行補償。兩種方法只在下圖不同，其他地方一致。下圖公式爲 q_target 的輸出值， DQN: Double DQN: Policy Gradient

Chasing中的小强

2020-07-07 11:10:39

強化學習--Pytorch--DDPG

DDPG介紹及其示例 Deep Deterministic Policy Gradient是DeepMind團隊爲Actor-Critic方法打造的升級版本，其實也就是Actor-critic和DQN的融合版本。下面給出示例程序，

Chasing中的小强

2020-07-07 11:10:37

強化學習--Pytorch--DQN

DQN的學習效果還是很驚豔的，首先放上本次實驗的代碼。和官方給出的例子一樣，是託舉平衡杆的問題。給出視頻鏈接：強化學習DQN import torch import torch.nn as nn import torch.nn.

Chasing中的小强

2020-07-07 11:10:37

基本數據：Tensor

文章目錄基本數據：Tensor一、Tensor數據類型二、Tensor的創建與維度查看三、Tensor的組合與分塊四、Tensor的索引五、Tensor的變形基本數據：Tensor Tensor，即張量，是PyTorch中的基本

我是一名好学者

2020-07-07 10:51:10

24小時熱門文章

最新文章

最新評論文章