mxnet学习(3):autograd

原創

2019-03-19 07:24

reference:https://mxnet.incubator.apache.org/api/python/autograd/autograd.html

1.基本操作

使用x.attach_grad()为梯度分配空间，调用with autograd.record()计算梯度，再使用backward()进行反传

2. BN and dropout

BN, dropout这些层在训练和测试的时候是不同的，BN在训练的时候是根据每个mini-batch的均值和方差进行计算并更新参数，在测试的时候是使用训练集上得到的一个参数进行计算。dropout在测试的时候是没有的。因此需要在不同的时候加以区别（这一点在pytorch中也是存在）。

使用with autograd.record():，默认为train_mode = True

也可以使用with autograd.train_mode(),with autograd.predict_mode()或者with autograd.record(train_mode = False)等方式手动控制

3. pause

可以在with autograd.record():中使用with autograd.pause()暂停保存梯度.

eg:

with autograd.record():
    y = model(x)
    backward([y])
    with autograd.pause():
        # testing, IO, gradient updates..

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

MXNet之gluonCV中关于路径的操作

GluonCV下載模型的源碼地址（test.py）： https://gluon-cv.mxnet.io/model_zoo/segmentation.html 說明記錄這個，是因爲每次使用gluoncv的模型，系統總是默認地址爲 C

丝贝视像-高精度计算机视觉

2020-07-04 11:26:02

mxnet教程1

import mxnet as mx #%matplotlib inline import os import subprocess import numpy as np import matplotlib.pyplot as plt

2020-07-01 16:04:50

Milvus 实战｜生物多因子认证系列 (二）：人脸识别

視覺 AI 作爲一個已經發展成熟的技術領域，具有豐富的應用場景和商業化價值，全球 40% 的 AI 企業都集中在視覺 AI 領域。近年來，視覺 AI 除了在智能手機、智能汽車、智慧安防等典型行業中發揮重要作用外，更全面滲入細分的實體行業

2020-07-07 15:32:19

[MXNet][原创]MXNet的加减乘除

A = mx.sym.Variable('A') B = mx.sym.Variable('B') C = A + B D = A - B E = A * B F = A / B # a = mx.nd.empty(1) # 生成一個

2020-07-07 05:29:23

工程实践_LFFD模型训练过程疑难杂症debug

1.MxNet版本的LFFD需要安裝CUDA10.1版本和CuDNN 若不滿足會出現如下問題：安裝的CUDA版本太低或沒有安裝： raceback (most recent call last): File "configu

2020-07-04 11:57:16

基于mxnet的BP神经网络识别26个英文小写字母

import logging logging.getLogger().setLevel(logging.INFO) import mxnet as mx import numpy as np fname = mx.test_utils

2020-07-01 16:04:50

mxnet讨论区

mxnet討論社區

2020-06-30 21:58:16

Windows10安装tensorflow+mxnet踩坑

我是在Anaconda Prompt中安裝的，一開始直接安裝了Tensorflow2以上的版本，結果與manet所需要的環境依賴（如requests包）衝突，可以大致看一下：導致報錯，報的錯是OSError：解決辦法的核心思路就

2020-06-29 13:28:01

NDArray的简单操作

NDArray是MXNet中的一種數據操作工具，類似於Numpy. 創建： x =nd.arange(6) [0. 1. 2. 3. 4. 5.] x = nd.zeros((2,3)) [[0 0 0] [0 0 0 ]]

2020-06-29 08:03:39

深度学习系列之一：简介

通俗來說，機器學習是一門討論各式各樣的適用於不同問題的函數形式，以及如何使用數據來有效地獲取函數參數具體值的學科。深度學習是指機器學習中的一類函數，它們的形式通常爲多層神經網絡。近年來，仰仗着大數據集和強大的硬件，深度學習已逐漸成爲處理圖

2020-06-29 06:57:45

深度学习系列之X：各类数学公式的介绍

1. 正態分佈（1）概念正態分佈（英語：normal distribution）又名高斯分佈（英語：Gaussian distribution），是一個非常常見的連續概率分佈。則其概率密度函數爲

2020-06-29 06:57:45

不同深度学习框架下的默认数据通道顺序及转换

參考：https://blog.csdn.net/duan19920101/article/details/104487079 下面是不同框架下的默認數據通道順序 Caffe: NCHW NCNN: CHW tensorflow: NHW

2020-06-27 10:33:03

mxnet转ncnn模型量化及使用

參考https://www.cnblogs.com/wanggangtao/p/11352948.html 一、mxnet模型轉ncnn模型可以參考上篇博客文章 https://blog.csdn.net/kupepoem/articl

2020-06-27 09:39:18

insightface rec文件结构分析

參考：https://www.cnblogs.com/hellcat/p/9094806.html#_label2_1 環境：windows7，anaconda3，mxnet 1.2.1 一、MXIndexedRecordIO文件簡介隨

2020-06-27 09:39:17

mxnet rec文件内容分析

環境：anaconda3，mxnet1.21，win7，intel處理器參考：https://blog.csdn.net/kupepoem/article/details/105237746 一、MXIndexedRecordIO文件簡

2020-06-27 09:39:17

24小時熱門文章

最新文章

最新評論文章