pytorch中model eval和torch no grad()的區別

原創

2020-06-15 02:04

model.eval()和with torch.no_grad()的區別

在PyTorch中進行validation時，會使用model.eval()切換到測試模式，在該模式下，

主要用於通知dropout層和batchnorm層在train和val模式間切換
- 在train模式下，dropout網絡層會按照設定的參數p設置保留激活單元的概率（保留概率=p); batchnorm層會繼續計算數據的mean和var等參數並更新。
- 在val模式下，dropout層會讓所有的激活單元都通過，而batchnorm層會停止計算和更新mean和var，直接使用在訓練階段已經學出的mean和var值。
該模式不會影響各層的gradient計算行爲，即gradient計算和存儲與training模式一樣，只是不進行反傳（backprobagation）
而with torch.no_grad()則主要是用於停止autograd模塊的工作，以起到加速和節省顯存的作用，具體行爲就是停止gradient計算，從而節省了GPU算力和顯存，但是並不會影響dropout和batchnorm層的行爲。

使用場景

如果不在意顯存大小和計算時間的話，僅僅使用model.eval()已足夠得到正確的validation的結果；而with torch.zero_grad()則是更進一步加速和節省gpu空間（因爲不用計算和存儲gradient），從而可以更快計算，也可以跑更大的batch來測試。

參考

https://discuss.pytorch.org/t/model-eval-vs-with-torch-no-grad/19615/38
https://ryankresse.com/batchnorm-dropout-and-eval-in-pytorch/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

聽一首歌，只爲一句詞

聽一首歌，只爲一句詞

2020-07-08 10:36:09

idea啓動springboot項目點擊run按鈕及debug按鈕項目沒任何反應

遇到這個問題是不小心用webstorm打開了spring-boot項目，導致jb家的軟件工作空間亂了。解決辦法，關掉webstorm，重啓idea，問題自動解決。

马挺_搞事林_沃德司机

2020-07-08 09:03:04

半邊

半邊夕陽半邊山，半江青水半隻船；半袖寒風半袖秋，半眼微波半面愁；半夜梧桐半月樓，半盞辰星半杯酒。山，看一半，一半闢人徑，一半破天穹；船，浮一半，一半載人行，一半渡蒼生；酒，飲一半，一半嘆人生，一半敬鬼雄。

2020-07-08 07:29:40

mybatisPlus添加一條記錄後怎麼獲取Id

MybatisPlus在執行了添加語句以後，傳入的要保存的對象因爲是引用類型就被設置了Id，所以後面直接通過getId()獲取Id即可。

野比大雄的代码危机

2020-07-07 17:44:20

springboot註解方式讀取配置文件，創建配置文件常量類

1、讀取配置文件方式 @Value("${...}") private String property; 2、創建配置文件常量類以創建阿里雲OSS常量類爲例： // 當項目已啓動，spring接口，spring加載之後，執行接

野比大雄的代码危机

2020-07-07 17:44:20

搶票原理通俗解釋，候補購票是什麼？你還在交智商稅嗎？

以下爲搶票通俗解釋與說明基本事實：所有的票都由12306放出，所有購票都基於12306。概念：單一程序搶票：由程序快速刷新12306購票（可理解爲一個爬蟲程序）搶票平臺搶票：基於程序搶票（可理解爲集成衆多爬蟲程序）手動搶票：

2020-07-07 17:33:53

今天晚上加班,爭取搞定剩下的需求。

週一去客戶哪兒，準備驗收．ＢＴ的客戶拿出以前在網上收集的哪些所謂需求一條一條進行驗證．沒辦法，有些沒實現的功能還是得做．其實也只能怪自己，對客戶的這些要求沒有上升到最最高度．不過，通過這個項目．自己還是學到了很多東西．等結項了寫個總

2020-07-07 17:00:57

兒子感冒了，明天放假就回去看他。

天氣太冷了，半歲的兒子感冒了，他媽媽打來的電話告訴我的。要住院輸液。估計要1周！這幾天心情很是不好~~~但願兒子早點好起來！

2020-07-07 17:00:56

科舉制度沒有真正的贏家

一將功成萬骨枯！有人把高考比喻成獨木橋，也有人說是魚躍龍門。在我看來，過了獨木橋的人是死，摔下獨木橋的也是死，越過龍門的是死，沒過龍門的也是死。他們的青春，被死死的鎖在教室裏，他們的青春，被無償的交給了讓他們覺得百無聊賴的教科書中。他們的

2020-07-07 16:35:41

WebBench壓測工具學習筆記

WebBench 的官方 GitHub 地址在這裏 main函數裏有兩個重要的子函數： build_request() bench() 使用getopt_long()函數解析命令行參數（需要 include 頭文件getopt.h

2020-07-07 15:53:35

VS開發工具學習

MSVCRTD.lib(crtexe.obj) : error LNK2019: 無法解析的外部符號 _main，該符號在函數 ___tmainCRTStartup 中被引用把項目－屬性－連接器－系統－子系統中把控制檯改爲windows

2020-07-07 10:47:25

騰訊雲Ubuntu下搭建FTP服務器

之前用騰訊雲搭建WordPress環境使用的是第三方鏡像庫，使用起來各種問題，而且不是自己裝的系統，用起來各種不方便，遂重做系統，一步步搭建！看了很多相關博客，會出現各種各樣的錯誤，本文是我親自測試，有幾點特別需要注意的

2020-07-07 10:30:07

Win10配置java環境注意事項（不同於Win7）

今天重新配置java的環境，看了很多博客，基本都是說win7下的設置，win10有一點不同的地方，不注意的話，一直會提示javac不是內部命令。 1、下載安裝JDK，這裏不再說了； 2、找到控制面板——系統——高級系統設置——編輯環境

2020-07-07 10:30:07

SQLAlchemy使用UUID

在使用SQLAlchemy時，如果主健使用uuid時import uuid id = db.Column(db.String(32), default=uuid.uuid4().hex, primary_key=True)上述寫法，如果

2020-07-07 10:30:07

復工證明怎麼寫企業復工證明模板

本文轉載自DuShuSir.com 原文鏈接https://dushusir.com/back-to-work-certificate/ 問題: 2020年新年,所有人過的都不好,在這裏首先祝福大家身體健康.2月份遇到返程復工高潮

2020-07-07 06:13:35

24小時熱門文章

最新文章

最新評論文章