Pytorch訓練加速技巧小結

原創

时光碎了天

2020-06-25 04:05

1.有時我們會發現，使用Pytorch的模型，訓着訓着，越來慢了或者outofmemory，這時我們該怎麼解決呢？

主要是因爲，模型可能在不斷的產生臨時變量，這個時候，我們可以設置程序每隔多少次進行一次清除操作：torch.cuda.empty_cache()

2.在數據讀取速度不變的情況下，怎樣進一步提高模型的訓練速度呢？

PyTorch 會默認使用 cuDNN 加速，並且cuDNN 裏面是有很多加速算法，有些加速算法是針對大矩陣，有些加速算法是針對小矩陣，但 torch.backends.cudnn.benchmark=False，會導致，模型所選擇的cuDNN裏面的加速算法只是一個通用的，並不是最優。當 torch.backends.cudnn.benchmark=True的時候，模型就會爲每一步選擇一個最優cuDNN 加速算法，所以第一步的訓練速度是慢於常規，但後面都是快於常規。

但使用這個是有一個前提，模型結構在訓練過程中是不變化的，傳入數據批次和大小數也是不變的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

tensorflow init、build 和call小結

1.介紹在使用tf構建網絡框架的時候，經常會遇到__init__、build 和call這三個互相搭配着使用，那麼它們的區別主要在哪裏呢？ 1）__init__主要用來做參數初始化用，比如我們要初始化卷積的一些參數，就可

时光碎了天

2020-06-25 03:11:11

Pytorch中的train和eval用法注意點

1.介紹一般情況，model.train()是在訓練的時候用到，model.eval()是在測試的時候用到 2.用法如果模型中沒有類似於BN這樣的歸一化或者Dropout，model.train()和model.eval(

时光碎了天

2020-06-25 03:11:10

nvidia-smi 無進程佔用GPU，但GPU顯存卻被佔用了

問題：有時我們在使用GPU的時候，因爲某個原因，導致GPU被佔，但有無法通過nvidia-smi 看到進程編號，就會產生一個現象，GPU被未知程序所佔用，我們只能使用GPU的一部分，針對這種現象怎麼解決呢？方法1.

时光碎了天

2020-06-25 03:11:10

os.environ["TF_CPP_MIN_LOG_LEVEL"]小結

今天看tf代碼，突然發現代碼中有一個陌生的面孔：os.environ["TF_CPP_MIN_LOG_LEVEL"]=2，我就尋思百度了一下，看一下它是何方神聖？原來是配合log輸出信息來用。 os.environ["TF

时光碎了天

2020-06-25 03:11:10

TensorFlow訓練內（顯）存不斷增長

在使用tensorflow過程中，一個不標準的操作，就可能導致程序出各種bug，今天我們的豬腳就是“TensorFlow訓練內（顯）存不斷增長”，此問題並不是我遇到的，是公司一位同事遇到的，我把代碼翻了一下，看出了問題所在，由於一

时光碎了天

2020-06-25 03:11:10

Ubuntu系統下安裝（升級）NVIDIA顯卡驅動

1.介紹前不久tensorflow出來2.0版本，當我們去嘗試tf2.0的時候，可能會遇到一個問題，就是需要安裝cuda10的版本，我們才能正確安裝tf2.0，而此時的顯卡驅動版本太低，比如下圖中是384.54的版本，只支持c

时光碎了天

2020-06-25 03:11:10

python中numpy或opencv溢出小坑

时光碎了天

2020-05-01 00:48:10

pytorch init、forward和call小結

时光碎了天

2020-02-21 04:26:04

在家也能辦公之上網和遠程控制服務器

时光碎了天

2020-02-21 04:26:04

tensorflow init、build 和call小結

1.介紹在使用tf構建網絡框架的時候，經常會遇到__init__、build 和call這三個互相搭配着使用，那麼它們的區別主要在哪裏呢？ 1）__init__主要用來做參數初始化用，比如我們要初始化卷積的一些參數，就可

时光碎了天

2020-06-25 03:11:11

Pytorch中的train和eval用法注意點

1.介紹一般情況，model.train()是在訓練的時候用到，model.eval()是在測試的時候用到 2.用法如果模型中沒有類似於BN這樣的歸一化或者Dropout，model.train()和model.eval(

时光碎了天

2020-06-25 03:11:10

nvidia-smi 無進程佔用GPU，但GPU顯存卻被佔用了

問題：有時我們在使用GPU的時候，因爲某個原因，導致GPU被佔，但有無法通過nvidia-smi 看到進程編號，就會產生一個現象，GPU被未知程序所佔用，我們只能使用GPU的一部分，針對這種現象怎麼解決呢？方法1.

时光碎了天

2020-06-25 03:11:10

os.environ["TF_CPP_MIN_LOG_LEVEL"]小結

今天看tf代碼，突然發現代碼中有一個陌生的面孔：os.environ["TF_CPP_MIN_LOG_LEVEL"]=2，我就尋思百度了一下，看一下它是何方神聖？原來是配合log輸出信息來用。 os.environ["TF

时光碎了天

2020-06-25 03:11:10

TensorFlow訓練內（顯）存不斷增長

在使用tensorflow過程中，一個不標準的操作，就可能導致程序出各種bug，今天我們的豬腳就是“TensorFlow訓練內（顯）存不斷增長”，此問題並不是我遇到的，是公司一位同事遇到的，我把代碼翻了一下，看出了問題所在，由於一

时光碎了天

2020-06-25 03:11:10

Ubuntu系統下安裝（升級）NVIDIA顯卡驅動

1.介紹前不久tensorflow出來2.0版本，當我們去嘗試tf2.0的時候，可能會遇到一個問題，就是需要安裝cuda10的版本，我們才能正確安裝tf2.0，而此時的顯卡驅動版本太低，比如下圖中是384.54的版本，只支持c

时光碎了天

2020-06-25 03:11:10

24小時熱門文章

最新文章

最新評論文章