Pytorch中的train和eval用法注意點

原創

时光碎了天

2020-06-25 03:11

1.介紹

一般情況，model.train()是在訓練的時候用到，model.eval()是在測試的時候用到

2.用法

如果模型中沒有類似於BN這樣的歸一化或者Dropout，model.train()和model.eval()可以不要（建議寫一下，比較安全），並且model.train()和model.eval()得到的效果是一樣
如果模型中有類似於BN這樣的歸一化或者Dropout，並且程序需要邊訓練和邊測試，最好就是用model.eval()測試完之後，後面補一個model.train()。其中model.train()是保證BN用每一批數據的均值和方差，而model.eval()是保證BN用全部訓練數據的均值和方差；而對於Dropout，model.train()是隨機取一部分網絡連接來訓練更新參數，而model.eval()是利用到了所有網絡連接（結果是取了平均）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Pytorch訓練加速技巧小結

1.有時我們會發現，使用Pytorch的模型，訓着訓着，越來慢了或者outofmemory，這時我們該怎麼解決呢？主要是因爲，模型可能在不斷的產生臨時變量，這個時候，我們可以設置程序每隔多少次進行一次清除操作：torch.cud

时光碎了天

2020-06-25 04:05:05

tensorflow init、build 和call小結

1.介紹在使用tf構建網絡框架的時候，經常會遇到__init__、build 和call這三個互相搭配着使用，那麼它們的區別主要在哪裏呢？ 1）__init__主要用來做參數初始化用，比如我們要初始化卷積的一些參數，就可

时光碎了天

2020-06-25 03:11:11

nvidia-smi 無進程佔用GPU，但GPU顯存卻被佔用了

問題：有時我們在使用GPU的時候，因爲某個原因，導致GPU被佔，但有無法通過nvidia-smi 看到進程編號，就會產生一個現象，GPU被未知程序所佔用，我們只能使用GPU的一部分，針對這種現象怎麼解決呢？方法1.

时光碎了天

2020-06-25 03:11:10

os.environ["TF_CPP_MIN_LOG_LEVEL"]小結

今天看tf代碼，突然發現代碼中有一個陌生的面孔：os.environ["TF_CPP_MIN_LOG_LEVEL"]=2，我就尋思百度了一下，看一下它是何方神聖？原來是配合log輸出信息來用。 os.environ["TF

时光碎了天

2020-06-25 03:11:10

TensorFlow訓練內（顯）存不斷增長

在使用tensorflow過程中，一個不標準的操作，就可能導致程序出各種bug，今天我們的豬腳就是“TensorFlow訓練內（顯）存不斷增長”，此問題並不是我遇到的，是公司一位同事遇到的，我把代碼翻了一下，看出了問題所在，由於一

时光碎了天

2020-06-25 03:11:10

Ubuntu系統下安裝（升級）NVIDIA顯卡驅動

1.介紹前不久tensorflow出來2.0版本，當我們去嘗試tf2.0的時候，可能會遇到一個問題，就是需要安裝cuda10的版本，我們才能正確安裝tf2.0，而此時的顯卡驅動版本太低，比如下圖中是384.54的版本，只支持c

时光碎了天

2020-06-25 03:11:10

python中numpy或opencv溢出小坑

时光碎了天

2020-05-01 00:48:10

pytorch init、forward和call小結

时光碎了天

2020-02-21 04:26:04

在家也能辦公之上網和遠程控制服務器

时光碎了天

2020-02-21 04:26:04

Pytorch訓練加速技巧小結

1.有時我們會發現，使用Pytorch的模型，訓着訓着，越來慢了或者outofmemory，這時我們該怎麼解決呢？主要是因爲，模型可能在不斷的產生臨時變量，這個時候，我們可以設置程序每隔多少次進行一次清除操作：torch.cud

时光碎了天

2020-06-25 04:05:05

tensorflow init、build 和call小結

1.介紹在使用tf構建網絡框架的時候，經常會遇到__init__、build 和call這三個互相搭配着使用，那麼它們的區別主要在哪裏呢？ 1）__init__主要用來做參數初始化用，比如我們要初始化卷積的一些參數，就可

时光碎了天

2020-06-25 03:11:11

nvidia-smi 無進程佔用GPU，但GPU顯存卻被佔用了

問題：有時我們在使用GPU的時候，因爲某個原因，導致GPU被佔，但有無法通過nvidia-smi 看到進程編號，就會產生一個現象，GPU被未知程序所佔用，我們只能使用GPU的一部分，針對這種現象怎麼解決呢？方法1.

时光碎了天

2020-06-25 03:11:10

os.environ["TF_CPP_MIN_LOG_LEVEL"]小結

今天看tf代碼，突然發現代碼中有一個陌生的面孔：os.environ["TF_CPP_MIN_LOG_LEVEL"]=2，我就尋思百度了一下，看一下它是何方神聖？原來是配合log輸出信息來用。 os.environ["TF

时光碎了天

2020-06-25 03:11:10

TensorFlow訓練內（顯）存不斷增長

在使用tensorflow過程中，一個不標準的操作，就可能導致程序出各種bug，今天我們的豬腳就是“TensorFlow訓練內（顯）存不斷增長”，此問題並不是我遇到的，是公司一位同事遇到的，我把代碼翻了一下，看出了問題所在，由於一

时光碎了天

2020-06-25 03:11:10

Ubuntu系統下安裝（升級）NVIDIA顯卡驅動

1.介紹前不久tensorflow出來2.0版本，當我們去嘗試tf2.0的時候，可能會遇到一個問題，就是需要安裝cuda10的版本，我們才能正確安裝tf2.0，而此時的顯卡驅動版本太低，比如下圖中是384.54的版本，只支持c

时光碎了天

2020-06-25 03:11:10

24小時熱門文章

SQL優化-20231016

最新文章

最新評論文章