ubuntu16.04+GTX1660深度學習相關配置

1.前情提要

  • 本文使用cuda10.1,cuda8不行,cuda9沒試過
  • cudnn要使用顯卡以後發佈的版本,GTX1660發佈於20190222
  • 考慮到官網總是掛,可以在此下載cuda10.1cudnn
  • cudnn的developer版本安裝失敗,runtime版本缺少頭文件,所以安裝runtime版本,使用developer版本是頭文件,注意頭文件的命名

2.編譯caffe遇到的問題

  • 1、Check failed: error == cudaSuccess (8 vs. 0) invalid device function
    • 計算能力不匹配(如果驅動和軟件匹配可能不會遇到這個問題)
    • 修改Makefile.config中的CUDA_ARCH,重新編譯
    • -gencode arch=compute_62,code=[sm_62,compute_62]尚未試驗的方法
    CUDA_ARCH := -gencode arch=compute_30,code=sm_30 \
               -gencode arch=compute_35,code=sm_35 \
               -gencode arch=compute_50,code=sm_50 \
               -gencode arch=compute_52,code=sm_52 \
               -gencode arch=compute_53,code=sm_53 \
               -gencode arch=compute_61,code=sm_61 \
               -gencode arch=compute_70,code=compute_70
    
  • 2、Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNA
    • rm -rf ~/.nv
    • 驅動和軟件不匹配
    • 顯存不足,可以減小batch_size

3.知識點

  • 1、計算能力

CUDA SDK 8.0 support for compute capability 2.0 – 6.x (Fermi, Kepler, Maxwell, Pascal), last version with support for Compute Capability 2.x (Fermi)
CUDA SDK 7.5 support for compute capability 2.0 – 5.x (Fermi, Kepler, Maxwell)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章