深度学习系列（七）优化算法（梯度下降、动量法、AdaGrad算法、RMSProp算法、AdaDelta算法、Adam算法） 2020.6.24

原創

思源湖的鱼

2020-07-03 22:46

前言

在训练模型时，会使⽤优化算法不断迭代模型参数以降低模型损失函数的值
本节详细学习常用的优化算法

梯度下降
动量法
AdaGrad算法
RMSProp算法
AdaDelta算法
Adam算法

1、优化算法的挑战

优化算法的⽬标函数通常是⼀个基于训练数据集的损失函数
优化的⽬标在于降低训练误差

通常会遇上两个挑战

局部最小值
鞍点

局部最小值

如果f(x)在x上的值⽐在x邻近的其他点的值更小，那么f(x)可能是⼀个局部最小值（local minimum）
如果f(x)在x上的值是⽬标函数在整个定义域上的最小值，那么f(x)是全局最小值（global minimum）

当⼀个优化问题的数值解在局部最优解附近时，由于⽬标函数有关解的梯度接近或变成零，最终迭代求得的数值解可能只令⽬标函数局部最小化而⾮全局最小化

鞍点

梯度接近或变成零也可能是由于当前解在鞍点（saddle point）附近
如果在深度学习训练过程中，损失函数落到了局部最小值和鞍点上，必然会造成模型效果不是最佳
这是优化算法需要解决的问题

2、梯度下降

梯度下降应该是最常见的优化算法了
对于f(x)，其梯度是

f沿着单位向量u的方向导数是

我们希望找到f下降最快的方向，来迅速找到f的最小值
当u在梯度⽅向∇f(x)的相反⽅向时，⽅向导数被最小化
故有梯度下降

式中的超参数称作学习率
调整学习率也就是我们日常所说的调参了

随机梯度下降

当训练数据样本数很⼤时，梯度下降每次迭代的计算开销很⾼
随机梯度下降（stochastic gradient descent，SGD）减少了每次迭代的计算开销
在随机梯度下降的每次迭代中，我们随机均匀采样⼀个样本索引

这是对梯度的无偏估计

小批量随机梯度下降

传统的是对整个样本集进行梯度下降
随机梯度下降则是每次抽取一个样本
那我们同样可以每次抽取一小批样本B
得到梯度

其梯度下降

3、动量法

梯度下降根据⾃变量当前位置，沿着当前位置的梯度更新⾃变量
如果⾃变量的迭代⽅向仅仅取决于⾃变量当前位置，这可能会带来⼀些问题
动量法创建速度变量v
对小批量随机梯度下降的迭代做修改

动量超参数

4、AdaGrad算法

梯度下降和动量法使用统⼀的学习率，难以适应所有维度
引入AdaGrad算法，根据⾃变量在每个维度的梯度值的⼤小来调整各个维度上的学习率

将小批量随机梯度g按元素平⽅后累加到变量s
将⽬标函数⾃变量中每个元素的学习率通过按元素运算重新调整

其中，

不过，当学习率在迭代早期降得较快且当前解依然不佳时，AdaGrad算法在迭代后期
由于学习率过小，可能较难找到⼀个有⽤的解

5、RMSProp算法

RMSProp算法对AdaGrad算法做了⼀点小小的修改
该算法源⾃Coursera上的⼀⻔课程“机器学习的神经⽹络”

可以看到，是参考了动量法
使得⾃变量每个元素的学习率在迭代过程中不再⼀直降低

6、AdaDelta算法

AdaDelta算法也是针对AdaGrad算法的改进

相较于RMSProp算法
AdaDelta算法维护了⼀个额外的状态变量Δxt

然后更新自变量

7、Adam算法

Adam算法在RMSProp算法基础上对小批量随机梯度也做了指数加权移动平均

做偏差修正

更新自变量

结语

较为全面的学习了常用的优化算法

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

攻击者正在利用AI，对保险公司发起大规模欺诈

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

AI绘图新选择：Fooocus工具发布，小显存助力大模型运行

隨着人工智能技術的飛速發展，AI繪圖工具已經成爲了衆多創作者們的得力助手。它們能夠基於深度學習算法，快速生成高質量的圖像，爲設計、藝術等領域注入了新的活力。然而，傳統的AI繪圖工具往往對硬件要求較高，使得許多擁有較低配置設備的用戶望而卻步。

2024-05-07 23:30:10

2024年DataOps趋势预测：AI不会取代数据工程师

APM digest收集了多位行業專家對DataOps在2024的發展形勢及對IT和業務的影響的預測，這些技術最高管理者，包括Confluent技術戰略負責人Andrew Sellers的深刻洞見可能與你的感覺一致嗎？快來探討一下。數據可

2024-04-30 11:49:29

AIGC在京东广告创意的技术应用

一、前言電商廣告圖片不僅能夠抓住消費者的眼球，還可以傳遞品牌核心價值和故事，建立起與消費者之間的情感聯繫。然而現有的廣告圖片大多依賴人工製作，存在效率和成本的限制。儘管最近AIGC技術取得了卓越的進展，但其在廣告圖片的應

京東雲開發者

2024-05-08 23:24:18

GLM国产大模型训练加速：高效性能与成本优化的实践

隨着人工智能技術的不斷進步，大模型的訓練成爲了推動深度學習領域發展的重要力量。然而，傳統的訓練方式往往面臨着性能瓶頸和高昂的成本問題，這使得許多研究者和開發者望而卻步。爲了解決這一難題，我們探索了使用OneFlow框架對GLM國產大模型進行

2024-05-07 23:30:09

LoRA微调语言大模型的实用技巧与实践

隨着人工智能技術的不斷髮展，大型語言模型在各個領域的應用越來越廣泛。然而，大型語言模型的訓練成本高昂，且難以適應不同領域的具體需求。爲了解決這個問題，LoRA微調技術應運而生。本文將介紹LoRA微調語言大模型的實用技巧，幫助讀者更好地應用這

2024-05-09 12:48:45

海外市场成 ISV 新掘金地？生成式 AI 如何加速业务创新实践？Zilliz 有话说

期望瞭解 Zilliz 最新動態？想要與 Zilliz 線下探討 AI 時代向量數據庫的全球化佈局思考及典型實踐？機會來啦！5 月 10 日，Zilliz 將閃現亞馬遜雲科技的兩場活動現場（蘇州、西安），與大家共話行業發展與未來，歡迎報名

2024-05-08 21:21:54

程序员不存在了……吗？

近期，在談及人工智能的發展速度時，馬斯克預計，按照當前的技術進步速度，到2030年人工智能的智力可能超越人類，這項技術甚至有可能終結人類。那麼，人工智能的強大究竟對人類將帶來更多機遇還是危機呢？今天，我們特邀了《深入理解 FFmpeg

2024-05-08 11:12:06

京东科技数字化营销能力的演进与最佳实践| 京东云技术团队

1.導讀在當今數字化時代，全球互聯網用戶已超過50億人，中國的互聯網用戶數量更是達到10.5億，這爲企業提供了巨大的市場機遇和挑戰。根據市場研究公司的最新報告，全球數字營銷費用支出預計將在未來五年內進一步大幅增加，這表明數字化營銷已成爲

2024-05-07 23:17:11

电子合同一站式解决方案 | 京东云技术团队

一：平臺定位和優勢（爲什麼建） 1.1、平臺定位由京東科技業務中臺主導發起，聯合法律部、安全部共建，旨在爲業務提供電子合同管理的中臺化能力，當前已形成一套成熟的“全線上、全生命週期電子合同管理系統”，可提供包括合同模板創建、模板預覽、

2024-05-06 23:16:37

迅为RK3568开发板可以接哪些好玩的模块

iTOP-3568開發板採用瑞芯微RK3568處理器，內部集成了四核64位Cortex-A55處理器。主頻高達2.0Ghz，RK809動態調頻。集成了雙核心架構GPU，ARM G52 2EE、支持OpenGLES1.1/2.0/3.2、Op

2024-05-06 22:54:29

迅为RK3568开发板瑞芯微人工智能AI鸿蒙Linux安卓开发学习

PU：iTOP-3568開發板採用瑞芯微RK3568處理器，內部集成了四核64位Cortex-A55處理器。主頻高達2.0Ghz，RK809動態調頻。集成了雙核心架構GPU，ARM G52 2EE、支持OpenGL ES1.1/2.0/3.

2024-05-06 22:54:29

动词算子式通用代码生成器的根本原理，动词算子和域对象的笛卡尔积

如果您使用過動詞算子式通用代碼生成器，比如光，和平之翼，時空之門，仙童或者蓮花。一定對這一類代碼生成器的適應性，彈性和靈活性有深刻的體會。並好奇這一切是如何達到的。其實，這一切的特性都源於動詞算子式代碼生成器的根本原理：動詞算子和域對象的

2024-05-05 22:58:28

Baidu Comate：“AI +”让软件研发更高效更安全

4月27日，百度副總裁陳洋出席由全國工商聯主辦的第64屆德勝門大講堂，並發表了《深化大模型技術創新與應用落地，護航大模型產業平穩健康發展》主題演講。陳洋表示，“人工智能+”成爲催生新質生產力的重要引擎，對於企業而言，務必要抓住這一重要機遇，

2024-04-30 21:33:30

理论+实践，带你了解分布式训练

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

24小時熱門文章

最新文章

最新評論文章