在配置完環境以後運行程序,程序正常運行但是GPU沒有任務,此時判斷程序沒有在GPU上運行。調試步驟:
- 先查看cuda安裝有沒有問題:nvcc -V
可以看到cuda驅動等安裝沒有問題。
- 進程序去看.cuda()或者.todevice之類代碼,看程序確實放在GPU上了,故排除
但是在查看代碼是看到這裏是一個and,參數args.no_cuda是設置的Flase,所以問題因爲在torch.cuda.is_available(),沒有獲得cuda加速。
- 查看深度學習環境搭建torch.cuda.is_available()這裏返回了False,所以原因在這裏
Torch官網的版本只提供了CUDA 9.2和CUDA 10.1的版本,我的cuda是10.0的。所以這裏版本不對應導致Torch.cuda加速無法運行。
但是出現這個錯誤的原因有很多,但是因爲環境配置的比較倉促,所以查看了一下環境配置,懷疑是pytorch安裝版本不對應。
所以把torch,torchvision等相關安裝包全部刪除,安裝適合版本的torch。
pip install https://download.pytorch.org/whl/cu100/torch-1.1.0-cp37-cp37m-linux_x86_64.whl
pip install https://download.pytorch.org/whl/cu100/torchvision-0.3.0-cp37-cp37m-linux_x86_64.whl
再次運行:
再次運行程序,程序就可以在GPU上運行啦。