Tensorflow多GPU多進程佔用的問題

原創

2019-10-26 04:07

原文鏈接：https://blog.csdn.net/cyn618/article/details/71479939

Tensorflow多GPU多進程佔用的問題
作爲一個剛入門深度學習的新手，在使用實驗室的服務器要運行訓練自己的網絡的時候，經常出現有另外的同學也在訓練網絡，4個GPU總是有幾個被佔用。因此老是出現下面的警報：

2017-05-09 14:23:29.246012: W tensorflow/stream_executor/cuda/cuda_driver.cc:485] creating context when one is currently active; existing: 0x2a7d250
2017-05-09 14:23:29.514180: E tensorflow/core/common_runtime/direct_session.cc:137] Internal: failed initializing StreamExecutor for CUDA device ordinal 3: Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_OUT_OF_MEMORY; total memory reported: 8506179584
1
2
一開始以爲Tensorflow和cuda驅動不能同時運行太多個實例，但是又覺得如果是這樣的話那太不合理了。經過一番搜索後，發現了問題所在。
Tensorflow默認會使用儘可能多的GPU，並且佔用所使用的GPU。因此如果有別的Tensorflow正在使用GPU，而自己的程序使用默認配置，那麼是無法使用已經被使用的GPU的，也無法單獨使用一塊沒有被使用的GPU。
因此，我們可以在運行我們的tensorflow程序的時候，指定程序使用的特定GPU：

Ⅰ. 在終端上配置：
CUDA_VISIBLE_DEVICES=0 python your_python.py
1
或者：

export CUDA_VISIBLE_DEVICES="0"
python your_python.py
1
2
當然，你要先看看你的服務器的GPU配置，可以使用nvidia-smi命令,然後也可以指定多個GPU。

Ⅱ. 在代碼中配置：
import os
os.environ["CUDA_VISIBLE_DEVICES"]="0"
1
2
另外，我們也可以指定我們使用的顯存比例：

config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.4
session = tf.Session(config=config, ...)
————————————————
版權聲明：本文爲CSDN博主「cyn618」的原創文章，遵循 CC 4.0 BY-SA 版權協議，轉載請附上原文出處鏈接及本聲明。
原文鏈接：https://blog.csdn.net/cyn618/article/details/71479939

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Tensorflow多GPU多進程佔用的問題

[軟件工具百科] 互聯網資源歷史快照歸檔站點與數字圖書館

網易面試：SpringBoot如何開啓虛擬線程？

杭州的 IT 崩盤了麼？

程序員常見的文本查看工具

VS2022 解決方案打不開 .NET Framework 4.0 、 4.5 等老項目

Vue3 運行可以，build 打包發佈報錯，app.config.globalProperties 用法坑

既然測試也要求寫代碼，那乾脆讓開發兼任測試不就好了嗎？

ITSM落地經驗之建設藍圖規劃

PDF 補丁丁 1.0.2 版更新

奇怪！應用的日誌呢？？

圖像平滑處理，6種濾波總結的綜合示例【盒式濾波、均值濾波、高斯濾波、中值濾波、雙邊濾波、導向濾波】

圖片裁剪爲特定形狀 ppt

3D重建的進階瞭解---深度圖，網格，體素，點雲是什麼

Doxygen 10 分鐘入門教程

有未經處理的異常: 0xC0000374

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結