原创 pytorch多GPU訓練保存的模型,在單GPU環境下加載出錯

轉自:https://blog.csdn.net/tsq292978891/article/details/83586935 背景 在公司用多卡訓練模型,得到權值文件後保存,然後回到實驗室,沒有多卡的環境,用單卡訓練,加載模型時出

原创 pytorch 指定gpu訓練與多gpu並行訓練

轉自原文:https://blog.csdn.net/qq_29023939/article/details/88405459 一.指定一個gpu訓練的兩種方法: 1.代碼中指定 import torch torch.cuda.s

原创 踩坑!GPU上預訓練模型的下載!!!

之前都是在本地下載,然後傳到服務器上,可是最近復現深度學習代碼時候,傳輸預訓練模型的時候,發現ftp傳輸啊,總是有問題,有時候文件損壞,這個坑好浪費時間!!! 後來想到了wget,直接在服務器wget下載不就可以了?果然很好用: ti

原创 faster-rcnn系列assert (boxes[:, 2] >= boxes[:, 0]).all()和loss偶爾爲nan的問題

這個問題是發生在用自己的數據訓練faster rcnn的時候~ 問題: File "/py-faster-rcnn/tools/../lib/datasets/imdb.py", line 108, in append_flipped

原创 復現longcw/faster_rcnn_pytorch問題彙總

復現代碼的坑!!! 最近在復現大神的代碼,代碼鏈接:https://github.com/longcw/faster_rcnn_pytorch 當然不可能一帆風順,一路上出現各種問題,差點崩潰~ Pytorch版本必須是0.4.0,P

原创 RuntimeError: unexpected EOF. The file might be corrupted.

復現faster RCNN的一些坑啊 最近在復現faster RCNN的代碼https://github.com/jwyang/faster-rcnn.pytorch/tree/master,遇到了很多問題,一點點解決過來了,這不,在

原创 又來填tensorflow版本的坑----安裝tensorflow1.6.0

版本這個坑要時刻注意!!!革命尚未成功,同志仍需警惕版本!!! 之前安裝的tensorflow都是直接安裝默認版本,結果就是1.13版本的,然後復現代碼就是各種bug啊,各種error啊,果斷卸載,安裝tensorflow1.6.0版

原创 git克隆指定分支的代碼

之前git克隆代碼都是master分支的,由於這次發現需要的代碼不是master分支的,但是github上的git clone鏈接只是倉庫的地址,沒有關於分支的,怎麼處理?且看下方: 切換到指定分支 克隆指定分支代碼 複製倉庫地址

原创 升級pip後出現ImportError: cannot import name main

在Ubuntu中,升級了pip,再次使用pip 安裝相關的python包的時候就出現以下錯誤: ImportError: cannot import name main 問題解決:修改/usr/bin/pip文件 把下面的三行: f

原创 Tesla P100的arch填坑!!!

pytorch-faster-rcnn中的make.sh腳本中的關於GPU model對應的arch,這個真的很坑,由於本人的服務器是Tesla P100的,但是呢,一直因爲是Tesla k80!!! 根據這篇博客:https://b

原创 error: #error -- unsupported GNU version! gcc versions later than 6 are not supported!

當我在運行make.sh腳本的時候,出現以下錯誤: error: #error -- unsupported GNU version! gcc versions later than 6 are not supported! 經過

原创 安裝Pytorch0.4.0需要填的坑!!!

根據官網提供的舊版本的下載辦法: 安裝pytorch0.4.0: sudo pip install torch==0.4.0 -f https://download.pytorch.org/whl/cu90/stable 但是呢,

原创 ' error: command 'x86_64-linux-gnu-gcc' failed with exit status 1 '

運行faster-rcnn.pytorch/lib/make.sh腳本,出現錯誤: ' error: command 'x86_64-linux-gnu-gcc' failed with exit status 1 ' 谷歌到很多辦

原创 Tensorboard-pytorch簡單入門

安裝 pip install tensorboardX (對應tensorflow的版本) 或者源文件編譯: git clone https://github.com/lanpa/tensorboardX && cd tensor

原创 Pycharm退出py.test模式

有時候使用pycharm不小心進入了test模式,運行代碼時顯示爲Run ‘py.test xxx.py’” 只想運行代碼,不想進入這個test模式,只需要在在運行鍵旁邊進入‘Edit configuration’模式,這時候會看見左