對於“cudaCheckError() failed : invalid device function”錯誤的解決方法

我的問題出現在訓練faster_rcnn的時候,後來經過在網上尋找解決方案,找到的原因是gpu的計算能力與配置的不符

解決方法:

在make.sh裏面

nvcc -c -o roi_pooling.cu.o roi_pooling_kernel.cu \
    -D GOOGLE_CUDA=1 -x cu -Xcompiler -fPIC -arch=sm_52

有這樣一句代碼,我們需要關注-arch=sm_52這個參數,52這個數字就是與計算能力相關的,我的gpu型號K80,

對照上圖,對應是3.7,我設置成了3.5,也就是-arch=sm_35,沒有保存,個人推斷,只要設置成對應版本或者版本一下的數字就可以,還沒有試過其他的,有興趣的可以試一試。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章