GPU Bugs for Neural Network Training

原創

angry_snail_flying

2020-06-28 05:15

1. NCCL unhandled cuda error

問題：

RuntimeError: NCCL error in: /opt/conda/conda-bld/pytorch_1565272271120/work/torch/lib/c10d/ProcessGroupNCCL.cpp:290, unhandled cuda error
Traceback (most recent call last):
…
subprocess.CalledProcessError: Command ‘[’/home/user3/anaconda3/envs/open-mmlab/bin/python’, ‘-u’, ‘./tools/test.py’, ‘–local_rank=2’, ‘configs/collin/dcn/faster_rcnn_dconv_c3-c5_r50_fpn_1x–hrrsd.py’, ‘work_dirs/faster_rcnn_dconv_c3-c5_r50_fpn_1x–hrrsd/epoch_12.pth’, ‘–launcher’, ‘pytorch’, ‘–out’, ‘work_dirs/faster_rcnn_dconv_c3-c5_r50_fpn_1x–hrrsd/results.pkl’, ‘–show’]’ returned non-zero exit status 1.

解決：
修改可視的GPU，且必須保證這些GPU上沒有任何其他程序運行。

export CUDA_VISIBLE_DEVICES=0,5,6

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

樹結構工具類

一：樹結構實體 package com.it.tree; import lombok.Data; import lombok.experimental.Accessors; import java.util.List; /*

2020-07-08 03:06:50

關於gitFlow的一些總結

關於gitFlow的一些總結什麼是submodule，主要的目的就是，希望將多個獨立的項目，或者是第三方的項目嵌入到一個項目中進行統一的管理。抱着試試的態度，發現，還挺好玩的。如果說要總結gitFlow的原理，這個說上半天我倒

2020-07-08 01:40:04

1、Vue項目常用工具類-Untils

以下是項目中常用的工具類方法，大家可以收藏一下，方便日後使用。 ---------------------------------------------------------------------------------------

前端热爱者

2020-07-07 22:41:37

VM虛擬機不能運行遊戲解決方案

win7 有用;win 10 無效; 1. 修改虛擬機配置 2.模擬顯卡，針對檢測顯卡驅動的，軟件配置前先安裝VM tools 工具,修改配置; 修改虛擬機配置在文件尾部添加配置 monitor_control.res

2020-07-07 21:08:04

實現Tomcat熱更新部署

插件式的架構可以爲系統帶來極高的擴展性。典型的一個例子就是eclipse。我們可以下載各種各樣的插件來不斷豐富eclipse的功能，而eclipse本身卻不需要作任何改動。那麼在Java中如何實現插件機制呢? 動態加載實現插件式

2020-07-07 19:29:09

Java 獲取實體類的值，並且以逗號分隔

1. 工具類 import java.lang.reflect.Field; public class BeanUtils { // 獲取實體類的值，並且以逗號分隔 public static String getM

2020-07-07 17:43:47

druid加解密工具

引入druid依賴 <dependency> <groupId>com.alibaba</groupId> <artifactId>druid</artifactId> <ver

2020-07-07 16:54:59

JAVA 根據經緯度獲取兩點之間的距離

前（fei）言（hua）：最近搞“考勤系統”其中有個“考勤打卡不能超過設置打卡地點多少m需求”，查詢帖子，參照相關帖子，做個筆記，方便以後使用。先上測試結果吧: 比網上多數看不懂的算法要準確一些，雖然依然跟百度地圖上的測量結果稍有

2020-07-07 16:54:58

Java 16進制相關的部分基礎操作方法

沒什麼特殊引用類，有需要的朋友（可能通訊用的多一點）可以單個方法自行拿過去使用；另外推薦一個很厲害大神參與的開源項目，主要是包含一些常用的工具類，本菜鳥使用過部分方法，覺得很好用，用興趣的大佬可以去它官網詳細瞭解 <depende

2020-07-07 16:43:59

IDEA 常用快捷鍵(自用筆記)

1、new 對象——》Alt+Enter; 2、get/set、toString...——》Alt+Insert; 3、sout——》打印輸出語句（System.out.println()）; 4、psvm——》打印輸出main方法; 5

2020-07-07 07:25:30

7zip壓縮時過濾文件夾

創建一個.bat文件 @echo off ::設置7z的命令行程序路徑 set zip7=D:\7-Zip\7z.exe ::設置壓縮包保存路徑 set Save=F:\zippack ::當天日期，備份文件名 set curda

2020-07-06 21:58:32

經常使用的依賴

常用的權限:<uses-permission android:name="android.permission.INTERNET" /> <uses-permission android:name="android.permiss

2020-07-06 21:51:51

java實現阿里雲短信驗證

準備工作：阿里雲-RAM用戶登錄創建AccessKey，獲取AccessKeyId和AccessKeySecret 找到短信服務，獲取簽名獲取短信模板code 5.查看模板內容中的變量如圖變量則爲code

2020-07-06 19:53:37

CRC校驗工具----CRC8校驗（x8+x2+x+1）

Util類： public class CRC8Util { /** * CRC8 校驗多項式 x8+x2+x+1 * @param b * @param len * @ret

2020-07-06 19:53:37

CRC校驗工具----CRC16/X25校驗

util類 public class CrcUtil16{ /** *計算給定長度數據的16位CRC。 * @param pData * @param nLength * @return */ publi

2020-07-06 19:53:26

24小時熱門文章

最新文章

最新評論文章