目前網絡上配置caffe環境的教程很多,部分教程確實寫的不錯,比如https://blog.csdn.net/yhaolpz/article/details/71375762。但我在caffe安裝過程中依然遇到不少問題,記錄於此,於人方便於己方便。我的軟硬件環境是UBUNTU16.04 + 2 Xeon E5-2630v4 + 4 TITAN V。
1.在安裝caffe時執行命令 sudo make runtest -j20,出現瞭如下錯誤–Check failed: status == CURAND_STATUS_SUCCESS (201 vs. 0) CURAND_STATUS_LAUNCH_FAILURE*** Check failure stack trace: ***
解決方法:輸入命令sudo apt autoremove
,刪掉之前安裝的多餘組件。
原因分析:這個問題是多個不同版本的NVIDIA組件混合導致的,重新部署軟件環境時我安裝過不同的CUDA版本,也使用過sudo apt-get installnvidia-cuda-toolkit
。隨後我在某一項安裝相關操作(具體忘了)中發現系統提示,可以刪除無關內容,然後想到網上曾有句簡短回答,大意是不同版本數據混合導致問題。除此外我未看到有能解決問題的回答。
2.安裝caffe時,輸入命令sudo make caffe -j20
時出現錯誤:
from src/caffe/util/cudnn.cpp:2:
/usr/local/cuda/include/cudnn.h:63:26: fatal error: driver_types.h: 沒有那個文件或目錄
#include "driver_types.h"
解決方法:進入/usr/include/cudnn.h文件下,將#include ”driver_types.h”改成#include<driver_types.h>再運行就可以了。
3.caffe安裝完成後在python交互式命令行中輸入import caffe
後報錯如下:
from ._caffe import Net, SGDSolver, NesterovSolver, AdaGradSolver, \ ImportError: No module named _caffe
解決方法:編譯一下caffe的python接口即可——sudo make pycaffe
。
4.CUDNN的版本查看方法:
不同硬件環境的cudnn.h目錄可能不同,需要先搜索文件具體位置。輸入命令sudo find / -name *cudnn.h*
獲得文件的具體路徑後,cd至文件所在目錄。使用命令cat cudnn | grep CUDNN_MAJOR -A 2
如下圖所示。
如圖所示,此時CUDNN的版本是7.0.1。