如何防止Tensorflow分配整個GPU內存？

原創

2020-06-22 17:59

我在共享計算資源的環境中工作，也就是說，我們有幾臺服務器機器都配備了幾個Nvidia Titan X GPU。

對於小到中等尺寸的模型，Titan X的12GB通常足以讓2-3人在同一GPU上同時進行訓練。如果模型足夠小，以至於單個模型不能充分利用Titan X的所有計算單元，那麼實際上可以導致某種加速（相比串行多個訓練任務來說）。即使在GPU的併發訪問確實減慢了單個訓練時間的情況下，同時在GPU上擁有多個用戶運行的靈活性仍然不錯。

TensorFlow的問題在於，默認情況下，它會在GPU啓動時爲其分配全部可用內存。即使對於一個小型的2層神經網絡，我也看到Titan X的12 GB用完了。

有沒有辦法讓TensorFlow只分配4GB的GPU內存，如果知道這個數量對於給定的模型是足夠的？

最佳解決辦法

通過將tf.GPUOptions作爲可選config參數的一部分傳遞來構造tf.Session時，可以設置要分配的GPU內存部分：

# Assume that you have 12GB of GPU memory and want to allocate ~4GB:
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)

sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

per_process_gpu_memory_fraction充當同一機器上每個GPU上的進程將使用的GPU內存數量的硬上限。目前，這個比例被統一應用到同一臺機器上的所有GPU上;沒有辦法在per-GPU的基礎上進行設置。

次佳解決辦法

config = tf.ConfigProto()
config.gpu_options.allow_growth=True
sess = tf.Session(config=config)

https://github.com/tensorflow/tensorflow/issues/1578

參考資料

How to prevent tensorflow from allocating the totality of a GPU memory?

----------------------------------------------------------------------------------------------------------

原文：https://vimsky.com/article/3776.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

如何防止Tensorflow分配整個GPU內存？

最佳解決辦法

次佳解決辦法

參考資料

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

HttpSecurity 是如何組裝過濾器鏈的

如何防止Tensorflow分配整個GPU內存？

池化層max_pool中兩種paddding操作

tf.Session() vs tf.InteractiveSession()

TENSORFLOW：底層概念介紹

TENSORFLOW：GRAPH 和 SESSION續

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結