Tensorflow GPU訓練模型時假卡死

原創

2019-11-15 12:54

筆者在進行Tensorflow訓練ssd網絡進行目標檢測訓練時，發現會假卡死。故記錄下，供大家參考。

系統：
硬件 i5-8500 ddr4 2666 8G內存 gtx1070(8G顯存)。
軟件 win10 64bit CUDA 10.0（不要用10.1） cudnn 7.x Tensorflow 1.15.0
不賣館子，內存是關鍵
當然，在這種多架構需要一起搭配運行的系統。確實還可能存在其他不確定因素，筆者只是總結自己的經驗，大家少走彎路。

上圖就是筆者用上述軟件版本跑的結果，有標出一次step大約0.3秒。還有一次卡住用了110秒。但是這種卡死會隨着系統負載緩解後，繼續恢復。

一般情況，都是CPU負載一般，GPU計算負載一般（估計任務還不夠重），但是GPU顯存幾乎佔滿。
因爲當時開着Pycharm幹活，出現了內存滿，提示關閉Pycharm。
筆者估計需要用系統內存來坐交換，這時就會卡住。（任務管理器裏看不出來）

建議內存至少16G起配。若只有8G，可以換下
CUDA 9 cudnn 7.x Tensorflow ＜1.13.0(筆者用着1.11.0的版本試過可行。過高版本會報調用CUDA10.0的庫，找不到。)
這種搭配，CPU佔用比較高，GPU佔用一般，顯存負載也是滿。（任務管理器裏看）
測試同樣的訓練任務。一次step用時大約1.2秒。

爲了能提高效率，現在就用CUDA10.0 Tensorflow1.15.0 升級內存到16G
還是會出現假死，但是會明顯緩解。
Ubuntu上沒試過，如果大家有經驗，歡迎留言。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

內存分佈：棧，堆

非本人作也!因非常經典,所以收歸旗下,與衆人閱之!原作者不祥! 堆和棧的區別一、預備知識—程序的內存分配一個由c/C++編譯的程序佔用的內存分爲以下幾個部分 1、棧區（stack）— 由編譯器自動分配釋放，存放函數的參數值，局

2020-07-08 03:45:55

內存、句柄泄露檢測與調試

內存泄露檢測這段添加到測試代碼的最前面包含文件的下面 #define _CRTDBG_MAP_ALLOC #include <stdlib.h> #include <crtdbg.h> #ifdef _DEBUG #define ne

2020-07-08 07:15:25

性能測試中常見的幾種性能問題

前言：性能測試結果中，我們關注的指標是tps和art，如果tps低，或者響應時間長，或者服務器資源緊張，那就需要我們去定位性能問題了，常見的性能問題主要包含如下！ a.服務器問題 cpu 內存磁盤io 磁盤容量 b.網絡帶寬：看

2020-07-08 01:10:42

記一次java應用內存不斷增長問題解決過程

1、在解決問題之前，先看下jvm堆內存結構，如下圖所示：對於Java應用，虛擬機管理的內存，可以參考如下圖所示：一般對於一個應用來說，如果內存使用過大，可以從兩塊來分析，第一：堆內存，第二：堆外內存。下面着重從這兩個方面闡述下對最

2020-07-08 00:17:18

內存的5個分區

2020-07-07 23:44:36

C++ 繼承中的內存佈局（經典）

今天在網上看到了一篇寫得非常好的文章，是有關c++類繼承內存佈局的。看了之後獲益良多，現在轉在我自己的博客裏面，作爲以後複習之用。原文地址：http://blog.jobbole.com/108457/ ——談VC++對象模型

2020-07-07 19:58:08

2019.10.28C++學習筆記——堆、棧和存儲空間分類

C++學習筆記——堆、棧和存儲空間分類堆和棧：（1）管理方式：堆中資源由程序員控制（通過malloc/free、new/delete，容易產生memory leak），棧資源由編譯器自動管理。（2）系統響應：對於堆，系統有一

战地小记者

2020-07-07 17:41:43

c語言程序的運行

13.4 C語言程序的運行在嵌入式系統中，程序最終是要放置在內存中運行的，程序的幾個段，最終會轉化爲內存中的幾個區域。C語言可執行程序的內存佈局如圖13-5所示。圖13-5 C語言可執行程序的內存佈局在內存中，從低地址到高地址

2020-07-07 14:01:17

Android java代碼優化問題探究

總體原則：不做不必要的事，不分配不必要的內存 1、字符串頻繁操作時，多用StringBuffer少用String 2、儘量使用本地變量，即反覆使用的變量要先保存成臨時或者局部變量，尤其是循環中使用的變量 3、String方法中的subst

2020-07-06 21:52:13

snap佔用佔用100%

df -ia yll@yll-ubuntu:/snap/snapd$ df -ia 文件系統 Inode 已用(I) 可用(I) 已用(I)% 掛載點 sysfs 0

qq_wuqingdefeng

2020-07-06 20:00:15

計算對象所佔的內存空間

package observer; public class Sizeof { public static void main(String[] args) throws Exception { // W

2020-07-06 17:20:44

【揪出導致電腦黑屏的罪魁禍首】

很多網友都這樣問x系統吧小編：爲嘛我上網的時候常會遇到電腦黑屏？怎麼才能解決這個問題？這裏系統吧爲受過黑屏困擾的親們整理了一些小辦法，小編基本都試驗過，希望能對同學們有用。從此告別黑屏困擾。 1、檢查主機電源，工作是否正常

南山养鹿人

2020-07-06 16:06:56

深入Java核心 Java內存分配原理精講(1)

Java內存分配與管理是Java的核心技術之一，之前我們曾介紹過Java的內存管理與內存泄露以及Java垃圾回收方面的知識，今天我們再次深入Java核心，詳細介紹一下Java在內存分配方面的知識。一般Java在內存分配時會涉及到以下區域：

2020-07-06 04:37:41

java虛擬機知識整理——虛擬機的內存區域

java能獲得比較廣泛的認可，有一個比較重要的原因就是java具有平臺無關性：它實現了“一次編寫，到處運行”的理想。這個理想能夠實現，和不同的系統有相應配套的java虛擬機（簡稱JVM）的編譯和執行有關。一般的高級語言如果要在

2020-07-05 15:14:44

Ubuntu使用top/free查看內存佔用大的原因

使用free/top查看內存佔用的時候，嚇了一大跳，機器4GB的內存，顯示free空閒的內存只有300多M，查看了下進程，也沒有發現佔用大內存的應用啊。查了些資料，分享給大家。其實原理用一句話就可以說明白：就是查

2020-07-05 07:26:48

24小時熱門文章

最新文章

最新評論文章