optim package

原創

2020-02-20 16:51

Optimization package

This package contains several optimization routines for Torch.
Each optimization algorithm is based on the same interface:

x*, {f}, ... = optim.method(func, x, state)

where:

func: a user-defined closure that respects this API: (f,df/dx)=func(x) . Here f could be the loss for the network.
x: the current parameter vector (a 1D torch.Tensor)
state: a table of parameters, and state variables, dependent upon the algorithm
x*: the new parameter vector that minimizes f , x∗=argminxf(x)
{f}: a table of all f values, in the order they’ve been evaluated (for some simple algorithms, like SGD, #f == 1)

Important Note

The state table is used to hold the state of the algorihtm.
It’s usually initialized once, by the user, and then passed to the optim function
as a black box. Example:

state = {
   learningRate = 1e-3,
   momentum = 0.5
}

for i,sample in ipairs(training_samples) do
    local func = function(x)
       -- define eval function
       return f,df_dx
    end
    optim.sgd(func,x,state)
end

發佈了3 篇原創文章 · 獲贊 2 · 訪問量 3萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

PyTorch筆記之 scatter() 函數

scatter() 和 scatter_() 的作用是一樣的，只不過 scatter() 不會直接修改原來的 Tensor，而 scatter_() 會 PyTorch 中，一般函數加下劃線代表直接在原來的 Tensor 上修改 sca

2024-05-13 23:37:21

Ascend C 自定義PRelu算子

本文分享自華爲雲社區《Ascend C 自定義PRelu算子》，作者： jackwangcumt。 1 PRelu算子概述 PReLU是 Parametric Rectified Linear Unit的縮寫，首次由何凱明團隊提出，和Le

2024-04-08 10:33:15

9n-triton部署bert模型實戰經驗

一、背景對於算法工程師來說，通常採用python語言來作爲工作語言，但是直接用python部署線上服務性能很差。這個問題困擾了我很久，爲了緩解深度學習模型工程落地性能問題，探索了Nvidia提供的triton部署框架，並在九數中臺上完成

2024-04-01 11:15:58

RK35XX NPU開發指南

模擬環境開發這裏的模擬環境就是在PC上去模擬開發板的開發、調試，跟開發板本身沒有關係。我這裏的操作系統環境爲Ubuntu 20.04。首先安裝Anaconda，具體操作請參考烏班圖安裝Pytorch、Tensorflow Cuda環境

2023-10-28 13:42:10

使用 PAI-Blade 優化 Stable Diffusion 推理流程(二)

背景上一篇中，我們使用了 PAI-Blade 優化了 diffusers 中 Stable Diffusion 模型。本篇，我們繼續介紹使用 PAI-Blade 優化 LoRA 和 Controlnet 的推理流程。相關優化已經同樣在

2023-05-30 00:36:51

搭建openmmlab的mmcv v1.4遇到的問題

按照文檔安裝mmcv報錯在執行python setup.py build_ext 報錯缺少THE/THE.H庫更改安裝方式改用官網https://mmdetection.readthedocs.io/zh_CN/v2.25.

2023-05-22 01:22:01

PolyGen生成三維模型【深度學習】

本文將介紹如何利用深度學習技術生成3D模型，使用了PyTorch和PolyGen。 1、概述有一個新興的深度學習研究領域專注於將 DL 技術應用於 3D 幾何和計算機圖形應用程序，這一長期研究的集合證明了這一點。對於希望自己嘗試一些 3

2022-04-30 12:13:09

05 神經網絡的基本骨架 —— module 及卷積層

Pytorch關於神經網絡的包都在torch.nn裏 forward是前向傳播（backward是反向傳播） 1 卷積基礎 # 學習卷積層基礎 —— 卷積 input = torch.tensor([[1, 2, 0

2022-04-30 11:36:50

人體姿態檢測概述

人體姿態檢測分爲兩種方式，一種是自頂向下，一種是自底向上。自頂向下：先找人，將人體進行目標框檢測，再在目標框內去找人體的關鍵點，再進行關鍵點的連接。自底向上：先找點，後歸納。這裏我們不需要先找人的目標框。我們要找到圖像中的所有人

2022-04-30 05:55:46

圖神經網絡整理

關於圖的概念可以參考圖論整理，這裏不再贅述。圖神經網絡Graph neural networks(GNNs)是深度學習在圖領域的基本方法，它既不屬於CNN，也不屬於RNN。CNN和RNN能做的事情，GNN都能做。CNN、RNN不能做的事

2022-04-30 05:55:37

YOLO系列介紹(二)

接YOLO系列介紹 YOLOV4 上圖是YOLOV4的網絡結構。通過上圖，我們可以看到V4比V3無論在準確率上還是檢測速度上都有了一個很大的提升，在準確率上提升了10%，在速度上提升了12%。 YOLOV4並不是YOLO系列原作者

2022-04-30 05:55:36

PyTorch技術點整理

我們先從一個簡單的例子來看看PyTorch和Tensorflow的區別 import torch import tensorflow as tf if __name__ == "__main__": A = tor

2022-04-30 05:55:34

Mask RCNN介紹

Mask RCNN是何凱明大神以及Faster RCNN作者Ross B. Girshick等多人發表於ICCV 2017。我們知道對於圖像分類來說將一張圖片送進神經網絡之後得到其分類的概率。對於目標檢測來說我們將圖像送進神經網絡之

2022-04-30 05:55:27

手把手教你用Pytorch-Transformers——實戰（二）

本文是《手把手教你用Pytorch-Transformers》的第二篇，主要講實戰手把手教你用Pytorch-Transformers——部分源碼解讀及相關說明（一）使用 PyTorch 的可以結合使用 Apex ，加速訓練和減小顯存

2021-12-25 21:19:08

在 PyTorch 中保存訓練模型的最佳方法？ - Best way to save a trained model in PyTorch?

問題： I was looking for alternative ways to save a trained model in PyTorch.我一直在尋找在 PyTorch 中保存訓練模型的替代方法。 So far, I have

2021-10-10 09:19:34

24小時熱門文章

最新文章

最新評論文章