解決問題:ImportError: libcublas.so.9.0: cannot open shared object file: No such file

最近因爲疫情回不了學校,放血自費買了新裝備做實驗,配了一塊2060的顯卡,滿心歡喜地在tensorflow上跑訓練的代碼,結果報錯:ImportError: libcublas.so.9.0: cannot open shared object file: No such file。

好了,這就說明是cuda版本與tf不兼容了。

先說明一下環境,我是在conda創建的虛擬環境下運行的,python=3.6. 基本環境下cuda version = 9.2. 

當時配置tensorflow的時候明明是按照cuda9.2裝的tf1.8,怎麼會不兼容???於是我 nvcc -V。

於是,我好奇的創建新虛擬環境安裝tensorflow=1.8試試。

conda install tensorflow-gpu==1.8

看到報錯,尋思着tf1.8確實是受不了cuda10+哈哈哈,我要確定一下cuda驅動版本。

nvidia-smi

原來cuda驅動是10.1,cuda版本和驅動版本不一致,尷尬了。原來新電腦的顯卡驅動太新了。可參考英偉達官網的對應關係:

我錯在cuda driver是430.64,卻配置了cuda version=9.2. 好了,升級cuda版本吧,問題就解決了。當然tf要升級到2.0+了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章