1.前情提要
- 本文使用cuda10.1,cuda8不行,cuda9沒試過
- cudnn要使用顯卡以後發佈的版本,GTX1660發佈於
20190222
- 考慮到官網總是掛,可以在此下載cuda10.1,cudnn
- cudnn的developer版本安裝失敗,runtime版本缺少頭文件,所以安裝runtime版本,使用developer版本是頭文件,注意頭文件的命名
2.編譯caffe遇到的問題
- 1、Check failed: error == cudaSuccess (8 vs. 0) invalid device function
- 計算能力不匹配(如果驅動和軟件匹配可能不會遇到這個問題)
- 修改
Makefile.config
中的CUDA_ARCH
,重新編譯 -gencode arch=compute_62,code=[sm_62,compute_62]
尚未試驗的方法
CUDA_ARCH := -gencode arch=compute_30,code=sm_30 \ -gencode arch=compute_35,code=sm_35 \ -gencode arch=compute_50,code=sm_50 \ -gencode arch=compute_52,code=sm_52 \ -gencode arch=compute_53,code=sm_53 \ -gencode arch=compute_61,code=sm_61 \ -gencode arch=compute_70,code=compute_70
- 2、Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNA
rm -rf ~/.nv
- 驅動和軟件不匹配
- 顯存不足,可以減小batch_size
3.知識點
- 1、計算能力
CUDA SDK 8.0 support for compute capability 2.0 – 6.x (Fermi, Kepler, Maxwell, Pascal), last version with support for Compute Capability 2.x (Fermi)
CUDA SDK 7.5 support for compute capability 2.0 – 5.x (Fermi, Kepler, Maxwell)