今天跑代碼出現以下bug:
CUDA out of memory. Tried to allocate 60.00 MiB (GPU 0; 10.76 GiB total capacity; 9.03 GiB already allocated; 55.94 MiB free; 316.78 MiB cached)
看到實際內存還有20G,排除內存不夠的問題;
網上查到是pytorch與cuda版本不匹配原因;
輸入命令:watch -n 1 nvidia-smi
發現自己的cuda 版本是10.2。
但是運行
cat /usr/local/cuda/version.txt
顯示如下:
CUDA Version 10.0.130
CUDA Patch Version 10.0.130.1
以第二個爲準,(實際安裝第一個官網沒有安裝教程)
安裝命令如下:
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
在測試。。。