【keras】CUDNN_STATUS_ALLOC_FAILED 和 failed to run cuBLAS routine cublas ，keras和tensflow-gpu版本的問題

【報錯】
首先報錯：
could not create cudnn handle: CUDNN_STATUS_ALLOC_FAILED
嘗試解決：

https://blog.csdn.net/weixin_44754046/article/details/97663626

在最開頭添加：

import tensorflow as tf

config = tf.ConfigProto(gpu_options=tf.GPUOptions(allow_growth=True))
sess = tf.Session(config=config)
可以適當的使用GPU，But！

後又報錯：

failed to run cuBLAS routine cublasSgemm_v2: CUBLAS_STATUS_EXECUTION_FAILED
嘗試解決：

https://tbr8.org/how-to-solve-failed-to-run-cublas-routine-cublassgemm-v2-cublas-status-execution-failed-problem/
一般遇到這個問題都是cuda=9.0的，說要打補丁，心裏oso，但是我是cudu10 沒有補丁可以打，因爲官方只有一個文件可下載，沒有補丁。

排查過程：

1.注意：我在使用以下做驗證的時候，會發現自己在使用GPU2070，也就是說環境應該沒有問題。

import tensorflow as tf

with tf.device('/cpu:0'):
    a = tf.constant([1.0, 2.0, 3.0], shape=[3], name='a')
    b = tf.constant([1.0, 2.0, 3.0], shape=[3], name='b')
with tf.device('/gpu:0'):
    c = a + b

# 注意：allow_soft_placement=True表明：計算設備可自行選擇，如果沒有這個參數，會報錯。
# 因爲不是所有的操作都可以被放在GPU上，如果強行將無法放在GPU上的操作指定到GPU上，將會報錯。
sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=True))
# sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
sess.run(tf.global_variables_initializer())
print(sess.run(c))

# 打印所有的設備
from tensorflow.python.client import device_lib
#print(device_lib.list_local_devices())

2.再看下自己使用的是GPU還是CPU版本,都是使用GPU2070

# 查看所使用的tensorflow是GPU還是CPU版本
import os
from tensorflow.python.client import device_lib

os.environ["TF_CPP_MIN_LOG_LEVEL"] = "99"

if __name__ == "__main__":
    print(device_lib.list_local_devices())

3.最後認真看報錯，發現在node，是在用xception這個網絡的時候可分離卷積這裏也提示報錯。

x = SeparableConv2D(128, (3, 3), padding='same', use_bias=False)(x)
所以我猜測會不會是因爲這個網絡。
所以我試了幾層cnn網絡，ok，可以訓練，不報錯。
那麼問題來了，會不會是因爲版本太低造成的，因爲朋友說cuda 10 至少是tf=1.13和對應的keras，而我是tf=1.8 keras=2.1.5，可以嘗試下提高下版本。

我用conda安裝，發現會自動一鍵在虛擬環境中安裝cuda +cudunn。

之前我也是用conda insatall tensorflow-gpu==1.8，pip insatll keras=2.1.5.在公司1060上是沒有問題的，且因爲一鍵安裝cuda+cudnn，所以如下：

在公司GPU=1060的情況下是可以的，但是在自己電腦上GPU=2070就不行，同一份代碼，所以問題來了哈，就是GPU的問題。
雖然在虛擬環境下可以一鍵安裝cuda+cudnn，但是還是需要和GPU配套的，網上很多建議2070還是用cuda=1.0和對應配套的cudnn就好，要不然使用過程中會遇到些問題。
所以ok啦，1060可以用cuda10，但是2070不建議用cuda9，不向下兼容。

使用conda insatll tensorflow-gpu==1.14 ，conda insatll keras=2.2.5，
關於版本對應tf和keras，請看：https://docs.floydhub.com/guides/environments/

conda裝tf-gpu的時候會安自動裝numpy=1.18，在運行代碼時其會報警，大概就是numpy太高了，用numpy =1.13 就好啦，但是我卸載conda uninstall numpy=1.18時會把tensoflow-gpu=1.14和keras=2.2.5都卸載。
所以知道其中一個conda安裝的方式了，安裝一個需要的庫，會把相關的很多其他包都一起安裝了。
pip就不會啦，至少不會一鍋端，且用conda安裝的話才裝了幾個東西：
就好多東西被安裝了。多吧，實際上我只安裝了tf-gpu，keras，matplotlib ，opencv-python.以下都是自己配套按照的。

# Name                    Version                   Build  Channel
_tflow_select             2.1.0                       gpu    defaults
absl-py                   0.9.0                    py36_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
astor                     0.7.1                      py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
blas                      1.0                         mkl    https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
ca-certificates           2019.11.28           hecc5488_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
certifi                   2019.11.28               py36_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
cudatoolkit               10.0.130                      0    defaults
cudnn                     7.6.5                cuda10.0_0    defaults
cycler                    0.10.0                    <pip>
gast                      0.3.3                      py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
grpcio                    1.23.0           py36h3db2c7e_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
h5py                      2.9.0           py36hf098a70_1000    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
hdf5                      1.10.4          nompi_hcc15c50_1106    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
icc_rt                    2019.0.0             h0cc432a_1    defaults
imutils                   0.5.3                     <pip>
intel-openmp              2019.4                      245    defaults
joblib                    0.14.1                     py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
keras                     2.2.5                    py36_1    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
keras-applications        1.0.8                      py_1    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
keras-preprocessing       1.1.0                      py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
kiwisolver                1.1.0                     <pip>
libblas                   3.8.0                    14_mkl    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
libcblas                  3.8.0                    14_mkl    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
libgpuarray               0.7.6             hfa6e2cd_1003    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
liblapack                 3.8.0                    14_mkl    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
libprotobuf               3.11.4               h1a1b453_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
m2w64-gcc-libgfortran     5.3.0                         6    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2
m2w64-gcc-libs            5.3.0                         7    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2
m2w64-gcc-libs-core       5.3.0                         7    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2
m2w64-gmp                 6.1.0                         2    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2
m2w64-libwinpthread-git   5.0.0.4634.697f757               2    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2
mako                      1.1.0                      py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
markdown                  3.2.1                      py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
markupsafe                1.1.1            py36hfa6e2cd_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
matplotlib                3.1.3                     <pip>
mkl                       2019.4                      245    defaults
mkl-service               2.3.0            py36hfa6e2cd_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
msys2-conda-epoch         20160418                      1    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2
numpy                     1.18.1           py36hc71023c_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
opencv-python             4.2.0.32                  <pip>
openssl                   1.1.1d               hfa6e2cd_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
pandas                    1.0.1            py36he350917_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
pip                       20.0.2                     py_2    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
protobuf                  3.11.4           py36he025d50_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
pygpu                     0.7.6           py36hc8d92b1_1000    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
pyparsing                 2.4.6                     <pip>
pyreadline                2.1                   py36_1001    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
python                    3.6.5                         1    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
python-dateutil           2.8.1                      py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
pytz                      2019.3                     py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
pyyaml                    5.3              py36hfa6e2cd_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
scikit-learn              0.22.1           py36h7208079_1    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
scipy                     1.3.1            py36h29ff71c_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
setuptools                45.2.0                   py36_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
six                       1.14.0                   py36_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
tensorboard               1.14.0                   py36_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
tensorflow                1.14.0          gpu_py36h305fd99_0    defaults
tensorflow-base           1.14.0          gpu_py36h55fc52a_0    defaults
tensorflow-estimator      1.14.0           py36h5ca1d4c_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
tensorflow-gpu            1.14.0               h0d30ee6_0    defaults
termcolor                 1.1.0                      py_2    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
theano                    1.0.4           py36h6538335_1001    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
vc                        14.1                 h0510ff6_4    defaults
vs2015_runtime            14.16.27012          hf0eaf9b_1    defaults
vs2015_win-64             14.0.25420          h55c1224_11    defaults
werkzeug                  1.0.0                      py_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
wheel                     0.34.2                     py_1    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
wincertstore              0.2                   py36_1003    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
wrapt                     1.12.0           py36hfa6e2cd_0    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
yaml                      0.2.2                hfa6e2cd_1    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
zlib                      1.2.11            h2fa13f4_1006    https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge

起初本來想按照tf-gpu=1.13的，但用conda install tensorflow-gpu==1.13 說下載的通道沒有這個源，所以我用安裝了1.14
測試代碼如下：

import numpy
import tensorflow as tf
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
sess = tf.compat.v1.Session(config=tf.compat.v1.ConfigProto(log_device_placement=True))
print(sess.run(c))

成了，且解決了：failed to run cuBLAS routine cublasSgemm_v2: CUBLAS_STATUS_EXECUTION_FAILED問題。把

import tensorflow as tf

config = tf.ConfigProto(gpu_options=tf.GPUOptions(allow_growth=True))
sess = tf.Session(config=config)

去掉以後也不會報allow-failed 的錯了

這是keras版本的表情識別項目遇到的問題。

【keras】CUDNN_STATUS_ALLOC_FAILED 和 failed to run cuBLAS routine cublas ，keras和tensflow-gpu版本的問題

詐騙（殺豬盤）網站進行滲透測試

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

【Python】保存gym截圖

【譯】使用 GitHub Copilot 作爲你的編碼 GPS

Linux 服務器配置-安裝portainer-ce社區版

外行也能讀懂的網絡硬件設備功能原理速成

安裝Auto-GPT

HI_MPI_VPSS_GetChnFrame()獲得的數據進行顏色空間轉換問題

【轉載】C++源文件的後綴名問題

AS部署失敗，Device supports,but APK only supports...

【caffe】Ubuntu 18.04 64位編譯方式安裝caffe-cpu

His讀取圖片的整理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結