原创 cuda編程 一

一個grid中包含多個block 一個block中包含多個thread   對於不同的 組織方式都有各自不同的存儲空間 每個thread---私有local memery 每個block--shared memery 對於每個設備devi

原创 pytorch 總是遇到cuda out of memery,4塊卡,其中3塊一樣,另外一塊不一樣。。。

一般用法:(4塊卡完全一樣) CUDA_VISIBLE_DEVIS=0 python train.py 對於不一樣算力的顯卡來說,優先使用算力高的, 除非使用CUDA_DEVICE_ORDER=PCI_BUS_ID,讓其按照物理排序,而不

原创 數學之美(beauty of math) 百度網盤下載地址

鏈接: https://pan.baidu.com/s/1KYMJRYDo5qjPHTKhcZKcww 提取碼: 645a

原创 解讀RealMix:Towards Realistic Semi-Supervised Deep Learning Algorithms

來源:https://arxiv.org/pdf/1912.08766.pdf 官方代碼:https://github.com/uizard-technologies/realmix 主要貢獻: 1.在cifar10數據集上僅僅只利用每類

原创 python 列表保存爲json文件錯誤: TypeError: 2 is not JSON serializable

源代碼: f = open("abc.json",'w')  results.append({ "image_id": name, "disease_class":pred.cpu().numpy()[0]})  json_str = j

原创 用flask上部署keras模型出現模型不斷加載,導致內存資源耗完

  將app.run(host='0.0.0.0', port=8080, debug=True) 改成app.run(host='0.0.0.0', port=8080, debug=False)就好了。。 可能是因爲flask在調試模

原创 threading模塊基本幾點使用問題

第一點threading中使用多線程兩種方法: 1.使用回調 2.重寫run方法 關於守護進程setDaemon以及join方法問題 (1)Python中默認setDaemon(false)是設置用戶線程爲守護線程 效果:當用戶任務執行完

原创 Unsupervised Data Augmentation for Consistency Training

論文地址:https://arxiv.org/pdf/1904.12848v4.pdf 官方實現代碼(tensorflow):https://github.com/google-research/uda 同樣來自於谷歌的,偶然看到的,關於

原创 關於pytorch中,dataloader中的num_work運行機制的理解

最近遇到一個問題,發現dataloader中數據加載異常的慢,慢慢的排查到了dataloader這一步,我以前一直以爲num_work共同維護一個大小爲batch size的隊列,但是不是,它每次會開啓num_work個線程,分別去加載d

原创 pytorch DDP模式中總是出現OOM問題。。

主要原因是沒有進行及時的內存回收,導致顯卡內存暴增: 解決方式: 在每個batch 反向傳播後,加上下面的內存回收:         del loss         torch.cuda.empty_cache()         gc

原创 關於pytorch 使用DDP模式(torch.nn.parallel.DistributedDataParallel)時,DistributedSampler(dataset)用法解釋

最近由於要用到多卡去訓模型,嘗試着用DDP模式,而不是DP模式去加速訓練(很容易出現負載不均衡的情況)。遇到了一點關於DistributedSampler這個採樣器的一點疑惑,想試驗下在DDP模式下,使用這個採樣器和不使用這個採樣器有什麼

原创 conda 離線環境移動安裝

虛擬環境名稱:your_project 首先/xxx/anaconda3/envs/your_project conda create -n new_project --clone ./your_project --offline 注意:

原创 ERROR:Assertion failed: _importer_ctx.tensors().at(output.name()).is_tensor()

pytorch-<onnx-<tensorrt 在轉了onnx後,在tensorrt測試得到上述上錯誤。 模型forward 輸出preds_size部分對比: 正確:        preds = preds.transpose(1, 

原创 關於類激活圖(CAM)運行機制的解讀

CAM:https://arxiv.org/abs/1512.04150 Grad-CAM:https://arxiv.org/pdf/1610.02391v1.pdf Grad-CAM++:https://arxiv.org/abs/1

原创 pytorch dataload 出錯:: invalid argument 0: Sizes of tensors must match except in dimension 0

錯誤信息:”RuntimeError: invalid argument 0: Sizes of tensors must match except in dimension 0. Got 299 and 252 in dimension