目前网络上配置caffe环境的教程很多,部分教程确实写的不错,比如https://blog.csdn.net/yhaolpz/article/details/71375762。但我在caffe安装过程中依然遇到不少问题,记录于此,于人方便于己方便。我的软硬件环境是UBUNTU16.04 + 2 Xeon E5-2630v4 + 4 TITAN V。
1.在安装caffe时执行命令 sudo make runtest -j20,出现了如下错误–Check failed: status == CURAND_STATUS_SUCCESS (201 vs. 0) CURAND_STATUS_LAUNCH_FAILURE*** Check failure stack trace: ***
解决方法:输入命令sudo apt autoremove
,删掉之前安装的多余组件。
原因分析:这个问题是多个不同版本的NVIDIA组件混合导致的,重新部署软件环境时我安装过不同的CUDA版本,也使用过sudo apt-get installnvidia-cuda-toolkit
。随后我在某一项安装相关操作(具体忘了)中发现系统提示,可以删除无关内容,然后想到网上曾有句简短回答,大意是不同版本数据混合导致问题。除此外我未看到有能解决问题的回答。
2.安装caffe时,输入命令sudo make caffe -j20
时出现错误:
from src/caffe/util/cudnn.cpp:2:
/usr/local/cuda/include/cudnn.h:63:26: fatal error: driver_types.h: 没有那个文件或目录
#include "driver_types.h"
解决方法:进入/usr/include/cudnn.h文件下,将#include ”driver_types.h”改成#include<driver_types.h>再运行就可以了。
3.caffe安装完成后在python交互式命令行中输入import caffe
后报错如下:
from ._caffe import Net, SGDSolver, NesterovSolver, AdaGradSolver, \ ImportError: No module named _caffe
解决方法:编译一下caffe的python接口即可——sudo make pycaffe
。
4.CUDNN的版本查看方法:
不同硬件环境的cudnn.h目录可能不同,需要先搜索文件具体位置。输入命令sudo find / -name *cudnn.h*
获得文件的具体路径后,cd至文件所在目录。使用命令cat cudnn | grep CUDNN_MAJOR -A 2
如下图所示。
如图所示,此时CUDNN的版本是7.0.1。