【兼容調試】pytorch出現RuntimeError: CUDA out of memory時的一些解決方法

原創

2020-06-16 02:20

代碼方面

改小batch size
要適當刪除沒用的中間變量（雖然效果不大）

比如：del output
train的時候，累加loss 一定要+=loss.item()，不然會把loss的history也加進去，又佔顯存了
同理2，及時detach()

比如rnn decoder的輸出中把上一個時間步的輸出作爲下一個時間步的輸入，那麼這個輸入完全就可以.detach()
valid or test的時候，一定要with torch.no_grad()
用torch.cuda.empty_cache() 清除顯存

外部方面
換個大顯存的GPU…
當然有這個錢的話就不會有遇到這個error了…
所以
如果不能拓展顯存，那麼就及時關閉佔用顯存的軟件，因爲我剛剛同時開了pr，佔了幾百M，關了以後明顯佔用小了300m
然後重啓一下pycharm也會結束這個進程釋放一些因爲在佔用沒法完全清楚的顯存（也就大概200m吧）

Nvidia-smi 查看顯存佔用的情況哈

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【兼容調試】pytorch出現RuntimeError: CUDA out of memory時的一些解決方法

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

再談23種設計模式（3）：行爲型模式（學習筆記）

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

【論文筆記】Attention總結二：Attention本質思想 + Hard/Soft/Global/Local形式Attention

【讀書筆記】《深度學習入門——基於python的理論與實現》

【論文筆記】MRC綜述論文+神經閱讀理解與超越基礎部分總結

【兼容調試】AttributeError: 'NoneType' object has no attribute 'loader'

【論文筆記】ULMFiT——Universal Language Model Fine-tuning for Text Classification

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結