TF预测服务接口上线后内存泄漏'std::bad_alloc'等问题集锦

原創

2020-06-21 02:14

楼主环境：

	python3.6.8
	centos 7.2
	tensorflow 1.14.0

一泄漏位置查找方法：

报错部分原文:

	 terminate called after throwing an instance of 'std::bad_alloc'

工具：pympler

from pympler import tracker,summary,muppy

在web主程序添加：
memory_tracker = tracker.SummaryTracker()

在接口返回前添加：
memory_tracker.print_diff()

反人类办法:把怀疑的模块一个一个替换着注释掉，找到内存泄漏模块，
然后再进行代码排查

二由tf.train.Saver()引起的

在session开始前进行模型的重新设置，
tf.reset_default_graph()

解决办法：

在with tf.Session() as sess: 之后同时也要在with的范围以外（注意），添加

tf.reset_default_graph()

代码来重置默认的图，这样就能解决下一步执行代码
self.sess = tf.Session()
self.saver = tf.train.import_meta_graph(’./Model/model.ckpt.meta’)
self.saver.restore(self.sess, tf.train.latest_checkpoint(’./Model/’))

三 OOM问题

报错原文:

tensorflow:OOM when allocating tensor with shape[225,256,256,36] and type float on /job:localhost/re

原因是GPU OOM内存不够，因此可尝试改成批处理。即将训练的数据块调小。

参考链接：
https://stackoverflow.com/questions/39076388/tensorflow-deep-mnist-resource-exhausted-oom-when-allocating-tensor-with-shape

https://github.com/tensorflow/tensorflow/issues/609

四编码问题

报错部分原文:

SyntaxError: Non-UTF-8 code starting with '\xe5' in file

原因：编码格式不对

把相应Python程序文件的编码转成UTF-8格式
1、在文件第一行添加# encoding:utf-8

或2.在文件第一行添加# -- coding: gbk --

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

TF预测服务接口上线后内存泄漏'std::bad_alloc'等问题集锦

一泄漏位置查找方法：

二由tf.train.Saver()引起的

三 OOM问题

四编码问题

再谈23种设计模式（3）：行为型模式（学习笔记）

Power Automate Desktop 安装完，登录后老是提示one driver 错误

微前端学习笔记(4):从微前端到微模块之EMP与hel-micro方案探索

微前端学习笔记（1）：微前端总体架构概述，从微服务发微

985 硕士程序员，空窗 4 个月没有 Offer！

一文搞懂 Spring 循环依赖

赛博斗地主——使用大语言模型扮演Agent智能体玩牌类游戏。

VScode右键打开(添加到右键)

记一次 .NET某工控视觉自动化系统卡死分析

WindowsServer--SQL Server搭建主从同步实现读写分离 - 事务性分发

監測ceph集羣

ceph 學習筆記

TF預測服務接口上線後內存泄漏'std::bad_alloc'等問題集錦

rbd COW 鏡像克隆

人工智能入門系列之一：鳶尾花（Iris）多分類的神經網絡詳解及代碼實現

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

TF预测服务接口上线后内存泄漏'std::bad_alloc'等问题集锦

一 泄漏位置查找方法：

二 由tf.train.Saver()引起的

三 OOM问题

四 编码问题

一泄漏位置查找方法：

二由tf.train.Saver()引起的

四编码问题