利用Akitio Node Pro搭建Ubuntu 18.04 linux 上的 Cuda 開發環境

1.安裝Ubuntu 18.04操作系統

官網上下載iso,製作安裝盤進行安裝。
安裝完成後,系統自動就能識別出擴展塢來,如果已經安裝上GPU顯卡,也能夠自動識別出來,系統安裝過程後通過lspci就可以看到了,這點比較方便。老版本的ubuntu可能識別不出來。

2.安裝NVidia官網驅動

參考:Ubuntu 16.04 禁用 nouveau 安裝 nvidia顯卡驅動

3.安裝CUDA10、CUDNN

參考: Ubuntu18.04安裝CUDA10、CUDNN
cudnn需要註冊下載

4.安裝Tensorflow或者paddlepaddle

推薦使用Anaconda。
https://www.anaconda.com/distribution/#download-section
paddlepaddle
https://www.paddlepaddle.org.cn/documentation/docs/zh/beginners_guide/install/install_Ubuntu.html
tensorflow
參考:https://tensorflow.google.cn/install/pip

安裝教程安裝完成後可能會碰到這個坑:

  1. Can not find library: libcublas.so
    暫時加進去,sudo ldconfig /usr/local/cuda/lib64
    ldconfig幾個需要注意的地方:

    往/lib和/usr/lib裏面加東西,是不用修改/etc/ld.so.conf的,但是完了之後要調一下ldconfig,不然這個library會找不到。
    想往上面兩個目錄以外加東西的時候,一定要修改/etc/ld.so.conf,然後再調用ldconfig,不然也會找不到。
    如果想在這兩個目錄以外放lib,但是又不想在/etc/ld.so.conf中加東西(或者是沒有權限加東西)。那也可以,就是export一個全局變量LD_LIBRARY_PATH,然後運行程序的時候就會去這個目錄中找library。一般來講這只是一種臨時的解決方案,在沒有權限或臨時需要的時候使用。
    ldconfig做的這些東西都與運行程序時有關,跟編譯時一點關係都沒有。編譯的時候還是該加-L就得加,不要混淆了。
    總之,就是不管做了什麼關於library的變動後,最好都ldconfig一下,不然會出現一些意想不到的結果。不會花太多的時間,但是會省很多的事。
    再有,諸如libdb-4.3.so文件頭中是會含有庫名相關的信息的(即含“libdb-4.3.so”,可用strings命令察看),因此僅通過修改文件名以冒充某已被識別的庫(如libdb-4.8.so)是行不通的。爲此可在編譯庫的Makefile中直接修改配置信息,指定特別的庫名。

ps:在ubuntu18上安裝比較順利,一晚上就可以完成,之前搞了2天debian9,總是找不到內核文件,驅動安裝不上,顯卡無法使用,放棄了。NodePro對eGPU支持的比較好,500W的功率幾乎沒有帶不起來的卡,本身2個PCIe槽,擴展能力強。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章