最近因爲疫情回不了學校,放血自費買了新裝備做實驗,配了一塊2060的顯卡,滿心歡喜地在tensorflow上跑訓練的代碼,結果報錯:ImportError: libcublas.so.9.0: cannot open shared object file: No such file。
好了,這就說明是cuda版本與tf不兼容了。
先說明一下環境,我是在conda創建的虛擬環境下運行的,python=3.6. 基本環境下cuda version = 9.2.
當時配置tensorflow的時候明明是按照cuda9.2裝的tf1.8,怎麼會不兼容???於是我 nvcc -V。
於是,我好奇的創建新虛擬環境安裝tensorflow=1.8試試。
conda install tensorflow-gpu==1.8
看到報錯,尋思着tf1.8確實是受不了cuda10+哈哈哈,我要確定一下cuda驅動版本。
nvidia-smi
原來cuda驅動是10.1,cuda版本和驅動版本不一致,尷尬了。原來新電腦的顯卡驅動太新了。可參考英偉達官網的對應關係:
我錯在cuda driver是430.64,卻配置了cuda version=9.2. 好了,升級cuda版本吧,問題就解決了。當然tf要升級到2.0+了。