神经网络常见错误（Most Common Neural Net Mistakes）

原創

2020-02-21 09:31

神经网络常见错误（Most Common Neural Net Mistakes）

本文总结自Andrej Karpathy的一篇推特及其评论区。原推特链接

你没有尝试在一个batch上首先达到过拟合
你忘记转换train和eval模式
你忘记在.backward()之前设置.zero_grad()在Pytorch中
你向损失函数输入了一个经过softmax后的输出，但是可能你的损失函数需要一个原始概率作为输入
你没有在使用BatchNorm时将你的Linear层或Conv2d层的偏差设为False即设置bias=False
你错误的使用了.view() 和.permute()错误的认为它们是一个东西
初始学习率设置的过于大了
错误的数据增强（data augmentation）如：涉及左右的视觉任务使用随机mirror进行数据增强
你忘记将做完比较的tensor转回为float()类型，或加减byte()类型然而结果超出0-255的范围
忘记打乱训练集的数据（shuffle），导致一个batch内的数据有较强的关联
使用了错误的normalization，或训练和测试过程没有使用同样的normalization
在错误的维度上使用softmax或其他的loss
loss项使用了错误的符号
忘记在求和、平均、取最大值等操作是指明维度（dim/axis）如在平均一个batch的loss时
fine-tuning或feature extraction时：数据预处理不一致(如均值、方差与预训练集不同)

发布了25 篇原创文章 · 获赞 18 · 访问量 4万+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

PyTorch踩过的坑（长期更新，转载请注明出处）

最近在知乎看到有人轉載了這裏的內容，提醒一下，歡迎轉載，但是請註明出處，謝謝。 1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差異無論是對於模型還是數據，cuda()函數都能實現從CPU到GPU的

2020-07-08 10:35:24

通过PyTorch实现风格迁移

一.環境及數據集準備 pytorch 1.1.0 torchvision 0.3.0 cuda 9.0 數據集用的是COCO2014的train2014訓練集，使用ImageNet也可以需要用到在ImageNet上預訓練好的VG

2020-07-08 05:29:32

ResNet/ResNet-I3D/ResNet-I3D-SlowFast 源码阅读

文章目錄0. 前言1. ResNet50-2D2. ResNet-I3D3. ResNet-I3D-SlowFast 0. 前言目標：更好的理解2D/I3D/SlowFast模型。爲了實現MobileNet/Shuff

清欢守护者

2020-07-07 14:47:10

交叉熵+全连接层的构建

目錄1. 求熵2. 交叉熵3.用交叉熵進行多分類問題4.用nn.Linear構建全連接層5. 繼承nn.Module構建全連接層 1. 求熵 import torch def Entropy(x): y = -(x *

2020-07-07 09:20:35

2D函数最小值优化

import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D import torch def himmel

2020-07-07 09:20:35

visdom——数据可视化

安裝visdom win+R打開運行，鍵入： pip install visdom 打開使用，鍵入： python -m visdom.server 然後我電腦直接報錯就打不開visdom，然後我嘗試鍵入： visdom

2020-07-07 09:20:35

PyTorch使用tensorboard（远程服务器和本地计算机的联动）

本文基於Ubuntu16.04系統，Python3.7 --------------------------------------------------------------------------------- 首先是配置PyTo

2020-07-05 17:58:13

【PyTorch学习笔记】21：nn.RNN和nn.RNNCell的使用

這節學習PyTorch的循環神經網絡層nn.RNN，以及循環神經網絡單元nn.RNNCell的一些細節。 1 nn.RNN涉及的Tensor PyTorch中的nn.RNN的數據處理如下圖所示。每次向網絡中輸入batch個樣本，每

2020-07-04 16:08:30

PyTorch入门（二）——张量的创建

張量的創建張量張量的定義Tensor與Variable張量的創建1.直接創建torch.tensor()torch.from_numpy(ndarray)2.依據數值創建torch.zeros()torch.zeros_like(

2020-07-04 09:15:22

PyTorch安装与基础概念

Pytorch是Facebook 的 AI 研究團隊發佈了一個 Python 工具包,是Python優先的深度學習框架改進現有的神經網絡。 Pytorch提供了更快速的方法——不需要從頭重新構建整個網絡，這是由於 PyTorch

2020-07-04 02:07:53

pytorch实现CNN手写数字识别（MNIST）

導入依賴包 import torch import numpy as np from torch.utils.data import DataLoader from torchvision.datasets import mni

2020-07-04 02:07:53

pytorch(二)

numpy實現梯度下降 import numpy as np def func(x,y): return (1-x)**2+100*(y-x**2)**2 #函數對x求導 def dz_dx(x,y): ret

2020-07-04 02:07:53

Visdom可视化Pytorch训练过程

使用visdom可視化pytorch訓練過程，原文見Tmylla’s Blog。 visdom Visdom是支持torch和Numpy實時數據可視化工具。Support by feakbooksearch 。可視化界面

2020-07-04 02:07:53

用PyTorch实现多层网络：从感知机到多层神经网络

神經網絡中有許多的名詞，比如MLP\ANN\CNN\RNN\DNN等，在文章開始之前先給出一個大致說明，免得像我一樣爲了區分多層感知機(MLP)與多層神經網絡的概念搜索半天資料。首先，深度前饋網絡(deep feedforwar

2020-07-04 02:07:53

transformers库学习笔记（一）：安装与测试

印象中覺得transformers是一個龐然大物，但實際接觸後，卻是極其友好，感謝huggingface大神。原文見tmylla.github.io。安裝我的版本號：python 3.6.9；pytorch 1.2.0

2020-07-04 02:07:53

24小時熱門文章

最新文章

最新評論文章