跑模型的問題總結(一)

剛開始跑模型遇到了很多問題,感謝大神們的博客,自己對遇到的問題做個小總結~

一、tmux的使用:

1.新開一個會話---tmux new -s session_name
2.會話裏啓動進程後,回到原本界面的方法----先按下ctrl+b,然後再單獨按d
3.重新回到會話裏查看進程的方法:tmux a -t session_name 
4.查看會話中歷史記錄----先按ctrl+b,然後按Page Up ,Page Down
5.可以同時新建多個會話s1,s2,s3
   在會話間切換的命令: 先按ctrl+b ,再按s,然後就可以在會話間選擇其中一個,按enter進入。
6.關閉會話的方法: tmux kill -session -t session_name

這裏注意:有時ctrl+b沒反應,是因爲輸入法在中文模式,調成英文模式就好啦

二、顯卡佔用問題

程序終止,但顯卡仍然佔用:
1.查看佔用顯卡的進程
fuser -v /dev/nvidia*
2.終止進程
kill -9 pid

三、執行腳本時  沒有那個文件或目錄

出現這個錯誤是因爲不熟練linux編程,每次都從本機寫好再上傳服務器。 這是由於腳本文件在保存時使用了DOS文件(windows系統中)格式造成的,可以用vim打開文件,然後執行下列操作:
:set ff=unix
:wq

所以一定要好好熟練linux語法啊啊啊

四、卸載tensorflow

 pip uninstall protobuf
 pip uninstall tensorflow

五、Linux下環境變量PATH設置錯誤,導致:未找到命令

export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
echo $PATH
然後
vim ~/.bash_profile
添加PATH

六、pytorch 多GPU訓練

CUDA_VISIBLE_DEVICES=2 python  程序名

https://oldpan.me/archives/pytorch-to-use-multiple-gpus  這篇更詳細一些,謝謝博主~~~///(^v^)\\\~~~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章