跑模型的問題總結(一)

剛開始跑模型遇到了很多問題，感謝大神們的博客，自己對遇到的問題做個小總結~

一、tmux的使用：

1.新開一個會話---tmux new -s session_name
2.會話裏啓動進程後，回到原本界面的方法----先按下ctrl+b，然後再單獨按d
3.重新回到會話裏查看進程的方法：tmux a -t session_name
4.查看會話中歷史記錄----先按ctrl+b，然後按Page Up ，Page Down
5.可以同時新建多個會話s1,s2,s3
在會話間切換的命令：先按ctrl+b ，再按s，然後就可以在會話間選擇其中一個，按enter進入。
6.關閉會話的方法： tmux kill -session -t session_name

這裏注意：有時ctrl+b沒反應，是因爲輸入法在中文模式，調成英文模式就好啦

二、顯卡佔用問題

程序終止，但顯卡仍然佔用:
1.查看佔用顯卡的進程
fuser -v /dev/nvidia*
2.終止進程
kill -9 pid

三、執行腳本時沒有那個文件或目錄

出現這個錯誤是因爲不熟練linux編程，每次都從本機寫好再上傳服務器。這是由於腳本文件在保存時使用了DOS文件(windows系統中)格式造成的，可以用vim打開文件，然後執行下列操作:
:set ff=unix
:wq

所以一定要好好熟練linux語法啊啊啊

四、卸載tensorflow

pip uninstall protobuf
pip uninstall tensorflow

五、Linux下環境變量PATH設置錯誤，導致：未找到命令

export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
echo $PATH
然後
vim ~/.bash_profile
添加PATH

六、pytorch 多GPU訓練

CUDA_VISIBLE_DEVICES=2 python 程序名

https://oldpan.me/archives/pytorch-to-use-multiple-gpus 這篇更詳細一些，謝謝博主~~~///(^v^)\\\~~~

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

跑模型的問題總結(一)

剛開始跑模型遇到了很多問題，感謝大神們的博客，自己對遇到的問題做個小總結~

一、tmux的使用：

二、顯卡佔用問題

三、執行腳本時沒有那個文件或目錄

四、卸載tensorflow

五、Linux下環境變量PATH設置錯誤，導致：未找到命令

六、pytorch 多GPU訓練

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

ELMO,GPT &BERT

[CS224n] n gram & FastText

[CS224n] word2vector & glove

[CS224n]Word Vectors

[CS224n]第一講 NLP和深度學習入門

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

跑模型的問題總結(一)

剛開始跑模型遇到了很多問題，感謝大神們的博客，自己對遇到的問題做個小總結~

一、tmux的使用：

二、顯卡佔用問題

三、執行腳本時 沒有那個文件或目錄

四、卸載tensorflow

五、Linux下環境變量PATH設置錯誤，導致：未找到命令

六、pytorch 多GPU訓練

三、執行腳本時沒有那個文件或目錄