解決nvidia-docker 問題 nvidia-docker | Error: failed to run docker command

這個問題也是搞了好久才搞定,首先是換了新的主板,開機很慢,nvidia-docker 運行不了了 

由於要使用docker進行深度學習的程序部署,所以必須要調用顯卡GPU

網上搜了很久沒找到該問題的解決辦法   最終在自己的研究下終於解決

 

思路如下:

1.檢查默認的顯卡驅動是否禁用  lsmod|grep nouveau

2.如果沒有禁用默認的顯卡驅動,將會與nVidia的顯卡驅動衝突,運行nvidia-smi 命令沒有任何問題

3.vim /usr/lib/modprobe.d/dist-blacklist.conf

blacklist nouveau
options nouveau modeset=0

添加這兩行

4.給當前鏡像做備份:

 mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

建立新的鏡像:

dracut /boot/initramfs-$(uname -r).img $(uname -r)

然後重啓系統  再次驗證默認的顯卡驅動是否禁用  lsmod|grep nouveau

 

此外,selinux也會影響 禁用就沒問題了

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章