神經網絡常見錯誤（Most Common Neural Net Mistakes）

原創

2020-02-21 09:31

神經網絡常見錯誤（Most Common Neural Net Mistakes）

本文總結自Andrej Karpathy的一篇推特及其評論區。原推特鏈接

你沒有嘗試在一個batch上首先達到過擬合
你忘記轉換train和eval模式
你忘記在.backward()之前設置.zero_grad()在Pytorch中
你向損失函數輸入了一個經過softmax後的輸出，但是可能你的損失函數需要一個原始概率作爲輸入
你沒有在使用BatchNorm時將你的Linear層或Conv2d層的偏差設爲False即設置bias=False
你錯誤的使用了.view() 和.permute()錯誤的認爲它們是一個東西
初始學習率設置的過於大了
錯誤的數據增強（data augmentation）如：涉及左右的視覺任務使用隨機mirror進行數據增強
你忘記將做完比較的tensor轉回爲float()類型，或加減byte()類型然而結果超出0-255的範圍
忘記打亂訓練集的數據（shuffle），導致一個batch內的數據有較強的關聯
使用了錯誤的normalization，或訓練和測試過程沒有使用同樣的normalization
在錯誤的維度上使用softmax或其他的loss
loss項使用了錯誤的符號
忘記在求和、平均、取最大值等操作是指明維度（dim/axis）如在平均一個batch的loss時
fine-tuning或feature extraction時：數據預處理不一致(如均值、方差與預訓練集不同)

發佈了25 篇原創文章 · 獲贊 18 · 訪問量 4萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

PyTorch踩過的坑（長期更新，轉載請註明出處）

最近在知乎看到有人轉載了這裏的內容，提醒一下，歡迎轉載，但是請註明出處，謝謝。 1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差異無論是對於模型還是數據，cuda()函數都能實現從CPU到GPU的

2020-07-08 10:35:24

通過PyTorch實現風格遷移

一.環境及數據集準備 pytorch 1.1.0 torchvision 0.3.0 cuda 9.0 數據集用的是COCO2014的train2014訓練集，使用ImageNet也可以需要用到在ImageNet上預訓練好的VG

2020-07-08 05:29:32

ResNet/ResNet-I3D/ResNet-I3D-SlowFast 源碼閱讀

文章目錄0. 前言1. ResNet50-2D2. ResNet-I3D3. ResNet-I3D-SlowFast 0. 前言目標：更好的理解2D/I3D/SlowFast模型。爲了實現MobileNet/Shuff

清欢守护者

2020-07-07 14:47:10

交叉熵+全連接層的構建

目錄1. 求熵2. 交叉熵3.用交叉熵進行多分類問題4.用nn.Linear構建全連接層5. 繼承nn.Module構建全連接層 1. 求熵 import torch def Entropy(x): y = -(x *

2020-07-07 09:20:35

2D函數最小值優化

import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D import torch def himmel

2020-07-07 09:20:35

visdom——數據可視化

安裝visdom win+R打開運行，鍵入： pip install visdom 打開使用，鍵入： python -m visdom.server 然後我電腦直接報錯就打不開visdom，然後我嘗試鍵入： visdom

2020-07-07 09:20:35

PyTorch使用tensorboard（遠程服務器和本地計算機的聯動）

本文基於Ubuntu16.04系統，Python3.7 --------------------------------------------------------------------------------- 首先是配置PyTo

2020-07-05 17:58:13

【PyTorch學習筆記】21：nn.RNN和nn.RNNCell的使用

這節學習PyTorch的循環神經網絡層nn.RNN，以及循環神經網絡單元nn.RNNCell的一些細節。 1 nn.RNN涉及的Tensor PyTorch中的nn.RNN的數據處理如下圖所示。每次向網絡中輸入batch個樣本，每

2020-07-04 16:08:30

PyTorch入門（二）——張量的創建

張量的創建張量張量的定義Tensor與Variable張量的創建1.直接創建torch.tensor()torch.from_numpy(ndarray)2.依據數值創建torch.zeros()torch.zeros_like(

2020-07-04 09:15:22

PyTorch安裝與基礎概念

Pytorch是Facebook 的 AI 研究團隊發佈了一個 Python 工具包,是Python優先的深度學習框架改進現有的神經網絡。 Pytorch提供了更快速的方法——不需要從頭重新構建整個網絡，這是由於 PyTorch

2020-07-04 02:07:53

pytorch實現CNN手寫數字識別（MNIST）

導入依賴包 import torch import numpy as np from torch.utils.data import DataLoader from torchvision.datasets import mni

2020-07-04 02:07:53

pytorch(二)

numpy實現梯度下降 import numpy as np def func(x,y): return (1-x)**2+100*(y-x**2)**2 #函數對x求導 def dz_dx(x,y): ret

2020-07-04 02:07:53

Visdom可視化Pytorch訓練過程

使用visdom可視化pytorch訓練過程，原文見Tmylla’s Blog。 visdom Visdom是支持torch和Numpy實時數據可視化工具。Support by feakbooksearch 。可視化界面

2020-07-04 02:07:53

用PyTorch實現多層網絡：從感知機到多層神經網絡

神經網絡中有許多的名詞，比如MLP\ANN\CNN\RNN\DNN等，在文章開始之前先給出一個大致說明，免得像我一樣爲了區分多層感知機(MLP)與多層神經網絡的概念搜索半天資料。首先，深度前饋網絡(deep feedforwar

2020-07-04 02:07:53

transformers庫學習筆記（一）：安裝與測試

印象中覺得transformers是一個龐然大物，但實際接觸後，卻是極其友好，感謝huggingface大神。原文見tmylla.github.io。安裝我的版本號：python 3.6.9；pytorch 1.2.0

2020-07-04 02:07:53

24小時熱門文章

最新文章

最新評論文章