mxnet學習(3):autograd

原創

2019-03-19 07:24

reference:https://mxnet.incubator.apache.org/api/python/autograd/autograd.html

1.基本操作

使用x.attach_grad()爲梯度分配空間，調用with autograd.record()計算梯度，再使用backward()進行反傳

2. BN and dropout

BN, dropout這些層在訓練和測試的時候是不同的，BN在訓練的時候是根據每個mini-batch的均值和方差進行計算並更新參數，在測試的時候是使用訓練集上得到的一個參數進行計算。dropout在測試的時候是沒有的。因此需要在不同的時候加以區別（這一點在pytorch中也是存在）。

使用with autograd.record():，默認爲train_mode = True

也可以使用with autograd.train_mode(),with autograd.predict_mode()或者with autograd.record(train_mode = False)等方式手動控制

3. pause

可以在with autograd.record():中使用with autograd.pause()暫停保存梯度.

eg:

with autograd.record():
    y = model(x)
    backward([y])
    with autograd.pause():
        # testing, IO, gradient updates..

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

MXNet之gluonCV中關於路徑的操作

GluonCV下載模型的源碼地址（test.py）： https://gluon-cv.mxnet.io/model_zoo/segmentation.html 說明記錄這個，是因爲每次使用gluoncv的模型，系統總是默認地址爲 C

丝贝视像-高精度计算机视觉

2020-07-04 11:26:02

mxnet教程1

import mxnet as mx #%matplotlib inline import os import subprocess import numpy as np import matplotlib.pyplot as plt

2020-07-01 16:04:50

Milvus 實戰｜生物多因子認證系列 (二）：人臉識別

視覺 AI 作爲一個已經發展成熟的技術領域，具有豐富的應用場景和商業化價值，全球 40% 的 AI 企業都集中在視覺 AI 領域。近年來，視覺 AI 除了在智能手機、智能汽車、智慧安防等典型行業中發揮重要作用外，更全面滲入細分的實體行業

2020-07-07 15:32:19

[MXNet][原創]MXNet的加減乘除

A = mx.sym.Variable('A') B = mx.sym.Variable('B') C = A + B D = A - B E = A * B F = A / B # a = mx.nd.empty(1) # 生成一個

2020-07-07 05:29:23

工程實踐_LFFD模型訓練過程疑難雜症debug

1.MxNet版本的LFFD需要安裝CUDA10.1版本和CuDNN 若不滿足會出現如下問題：安裝的CUDA版本太低或沒有安裝： raceback (most recent call last): File "configu

2020-07-04 11:57:16

基於mxnet的BP神經網絡識別26個英文小寫字母

import logging logging.getLogger().setLevel(logging.INFO) import mxnet as mx import numpy as np fname = mx.test_utils

2020-07-01 16:04:50

mxnet討論區

mxnet討論社區

2020-06-30 21:58:16

Windows10安裝tensorflow+mxnet踩坑

我是在Anaconda Prompt中安裝的，一開始直接安裝了Tensorflow2以上的版本，結果與manet所需要的環境依賴（如requests包）衝突，可以大致看一下：導致報錯，報的錯是OSError：解決辦法的核心思路就

2020-06-29 13:28:01

NDArray的簡單操作

NDArray是MXNet中的一種數據操作工具，類似於Numpy. 創建： x =nd.arange(6) [0. 1. 2. 3. 4. 5.] x = nd.zeros((2,3)) [[0 0 0] [0 0 0 ]]

2020-06-29 08:03:39

深度學習系列之一：簡介

通俗來說，機器學習是一門討論各式各樣的適用於不同問題的函數形式，以及如何使用數據來有效地獲取函數參數具體值的學科。深度學習是指機器學習中的一類函數，它們的形式通常爲多層神經網絡。近年來，仰仗着大數據集和強大的硬件，深度學習已逐漸成爲處理圖

2020-06-29 06:57:45

深度學習系列之X：各類數學公式的介紹

1. 正態分佈（1）概念正態分佈（英語：normal distribution）又名高斯分佈（英語：Gaussian distribution），是一個非常常見的連續概率分佈。則其概率密度函數爲

2020-06-29 06:57:45

不同深度學習框架下的默認數據通道順序及轉換

參考：https://blog.csdn.net/duan19920101/article/details/104487079 下面是不同框架下的默認數據通道順序 Caffe: NCHW NCNN: CHW tensorflow: NHW

2020-06-27 10:33:03

mxnet轉ncnn模型量化及使用

參考https://www.cnblogs.com/wanggangtao/p/11352948.html 一、mxnet模型轉ncnn模型可以參考上篇博客文章 https://blog.csdn.net/kupepoem/articl

2020-06-27 09:39:18

insightface rec文件結構分析

參考：https://www.cnblogs.com/hellcat/p/9094806.html#_label2_1 環境：windows7，anaconda3，mxnet 1.2.1 一、MXIndexedRecordIO文件簡介隨

2020-06-27 09:39:17

mxnet rec文件內容分析

環境：anaconda3，mxnet1.21，win7，intel處理器參考：https://blog.csdn.net/kupepoem/article/details/105237746 一、MXIndexedRecordIO文件簡

2020-06-27 09:39:17

24小時熱門文章

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

最新文章

最新評論文章