剛開始跑模型遇到了很多問題,感謝大神們的博客,自己對遇到的問題做個小總結~
一、tmux的使用:
1.新開一個會話---tmux new -s session_name
2.會話裏啓動進程後,回到原本界面的方法----先按下ctrl+b,然後再單獨按d
3.重新回到會話裏查看進程的方法:tmux a -t session_name
4.查看會話中歷史記錄----先按ctrl+b,然後按Page Up ,Page Down
5.可以同時新建多個會話s1,s2,s3
在會話間切換的命令: 先按ctrl+b ,再按s,然後就可以在會話間選擇其中一個,按enter進入。
6.關閉會話的方法: tmux kill -session -t session_name
這裏注意:有時ctrl+b沒反應,是因爲輸入法在中文模式,調成英文模式就好啦
二、顯卡佔用問題
程序終止,但顯卡仍然佔用:
1.查看佔用顯卡的進程
fuser -v /dev/nvidia*
2.終止進程
kill -9 pid
三、執行腳本時 沒有那個文件或目錄
出現這個錯誤是因爲不熟練linux編程,每次都從本機寫好再上傳服務器。 這是由於腳本文件在保存時使用了DOS文件(windows系統中)格式造成的,可以用vim打開文件,然後執行下列操作:
:set ff=unix
:wq
所以一定要好好熟練linux語法啊啊啊
四、卸載tensorflow
pip uninstall protobuf
pip uninstall tensorflow
五、Linux下環境變量PATH設置錯誤,導致:未找到命令
export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
echo $PATH
然後
vim ~/.bash_profile
添加PATH
六、pytorch 多GPU訓練
CUDA_VISIBLE_DEVICES=2 python 程序名
https://oldpan.me/archives/pytorch-to-use-multiple-gpus 這篇更詳細一些,謝謝博主~~~///(^v^)\\\~~~