tensorflow：不要在session中定義運算

原創

2020-02-23 10:52

最近在做項目時，總是會有程序崩潰的問題，系統也沒有任何提示。最後通過監控系統發現是內存溢出造成的。

追查下去，發現一段類似這樣的代碼，在session中調用tensorflow的api進行運算：

import tensorflow as tf
X = tf.constant([[1,2,3], [3,2,4]], dtype=tf.float32)
W = tf.constant([[1,1],[2,2],[3,3]], dtype=tf.float32)
bias = tf.constant([1, 2], dtype=tf.float32)
y = tf.nn.softmax(tf.matmul(X, W) + bias)

with tf.Session() as sess:

    for i in range(10):
        print(i)
        sess.run(tf.nn.softmax(tf.matmul(X, W) + bias))

    writer = tf.compat.v1.summary.FileWriter("./graph", sess.graph)
    writer.close()

使用tensorboard查看內存泄漏的原因：

將計算圖展開爲

當然，這裏只是展開了softmax，其他節點也可以類似展開。

可以看到，在session中定義計算節點，存在一個很大的風險，就是會在計算圖中產生新的圖節點，如果像我這樣使用for循環運算，那麼節點數會無限增加，注意不僅僅是softmax節點在增加，其他計算節點也在增加，這樣的開銷會越來越大，直至程序崩潰。

爲了解決這個問題，我們應該使用上面定義的y的等式，在進入session前就已經將計算圖定義好，在session中直接調用，而不是重新搭建。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

tensorflow多元函數高階求導

在機器學習中，會遇到拉普拉斯方程問題。如 $$-\Delta u=f$$ 這裏是一個關於多變量的函數，譬如 . 那麼 $$\Delta u = \frac{\partial^2 u}{\partial x^2}+\frac{\par

夜晓岚渺渺

2020-07-04 17:43:42

tf.matmul函數用法

tf.matmul函數用法函數：tf.matmul 表示：將矩陣 a 乘以矩陣 b,生成a * b matmul( a, b, transpose_a=False, transpose_b=Fal

2020-07-02 01:34:38

tensorflow 中tf.strided_slice和tf.slice的區別

函數：tf.slice(inputs, begin, size, name) 作用：從列表、數組、張量等對象中抽取一部分數據 begin和size是兩個多維列表，他們共同決定了要抽取的數據的開始和結束位置 begin表示從in

2020-07-02 01:34:38

使用tensorflow2.x解決離散分佈之間的KL散度

寫在前面我看了一下keras文檔，想了解一下如何方便的計算KL散度，於是發現了一點線索。Keras文檔只寫了離散分佈的KL散度，它們不寫連續分佈的KL散度庫函數是有原因的，連續分佈太過於複雜，不同分佈之間有着不同的公式，無法統

2020-06-28 01:02:23

tensorflow2.x實現兩個多元高斯分佈之間的KL散度，很重要

文章目錄0.背景1. tensorflow矩陣操作1.1 多維矩陣的乘法1.1.1 tf.matmul函數1.1.2 使用 @ 重載函數1.2 多維矩陣的轉置1.2.1 用tf.expand_dims擴展維度1.2.2 tf.sq

2020-06-28 01:02:23

tensorflow幾個函數講解

tensorflow幾個函數講解博主原創多看tensorflow API 1、tf.clip_by_value(a,1e-10,1.0) 將a的值限制在1e-10—1.0之間 #coding:utf-8 import t

2020-06-25 10:28:39

L2正則化—tensorflow實現

L2正則化是一種減少過擬合的方法，在損失函數中加入刻畫模型複雜程度的指標。假設損失函數是J(θ) ，則優化的是J(θ)+λR(w) ，R(w)=∑ni=0|w2i| 。在tensorflow中的具體實現過程如下： #coding

2020-06-25 10:28:39

tensorflow模型保存與複用多種方式

抄襲一段：checkpoint是一個內部事件，該事件激活後會觸發數據庫寫進程將數據緩衝中的髒數據寫到數據文件中。 checkpoint主要2個作用：保證數據庫的一致性縮短實例恢復時間通俗的講，checkpoint像word的自動

2020-06-16 14:45:18

tensorflow conv1d的理解和實現

參考:1、https://blog.csdn.net/qq_16320025/article/details/89396718?utm_medium=distribute.pc_relevant.none-task-blog-BlogCo

夜晓岚渺渺

2020-06-14 00:28:45

【tensorflow基礎學習】Session的參數配置

在生成會話時，通常會設置構造函數的config參數來配置會話的一些選項。可以配置的選型有很多，比如並行的線程數、GPU分配策略、運算超時時間等。爲了配置能夠更方便地進行，可以使用tensorflow提供的configProto()函數的返

2020-06-13 10:59:32

【轉載】SimpleITK學習--圖像讀取

轉載地址：https://www.cnblogs.com/wzyuan/p/10495946.html 通常我會用simpleitk來讀取dicom文件，主要是爲了將dicom文件轉換爲numpy矩陣，便於輸入神經網絡，讀取dicom文件

2020-06-13 10:59:32

【tensorflow基礎學習】會話

會話--tensorflow運行模型一、tensorflow系統結構的概述從圖中可以看出tensorflow的整個系統在結構上大體可以分爲兩個子系統—前端系統和後端系統。其中前端系統提供編程模型，負責構造計算圖；後端系統提供運行時環

2020-06-13 10:59:32

【轉載】SimpleITK學習--基本概念

轉載地址：https://www.cnblogs.com/wzyuan/p/10493136.html SimpleITK是ITK的簡化接口，使用起來更加方便，有多種語言接口，我平時用的都是python版，安裝比較簡單，pip insta

2020-06-13 10:59:32

【tensorflow基礎學習】會話使用--使用with/as環境上下文管理器

With/as語句的設計是爲了和支持環境管理器協議的環境管理器對象一起工作。在python2.5中，with/as語句是默認不使用的。當然也可以選擇使用，這時需要import命令來激活： from _future_ import wit

2020-06-13 10:59:32

【tensorflow基礎學習】計算圖

初識計算圖與張量 Tensorflow程序中的計算過程可以表示爲一個計算圖（computation Graph，也稱一個有向圖（Directed Graph）），其作用與外觀都可以類比程序流程圖來理解，在計算圖上我們

2020-06-13 10:59:32

24小時熱門文章

最新文章

最新評論文章