激活函数快速理解

原創

2020-07-05 22:00

1、sigmoid函数

$f(x)=1/(1+e^{-x})$

$f(x)^{'}=f(x)*(1-f(x))$ $0 < f(x^{'}) < 0.25$

所以啊很明显，会导致梯度消失（因为在反向传播BPTT过程中，在对w求导时，会包含f(x)的导数，多层时就相当于0.25的n次方，前面的单元更新态度太小了，所以是梯度消失啦）

2、tanh函数

$f(x)=(e^{x}-e^{-x})/(e^{x}+e^{-x})$

$0 < f(x)^{'} < 1，且有很大概率在0附近$ ，且有很大概率在0附近，所以根据上面所述，就是会梯度消失呀

3、Relu函数

优点：避免梯度消失问题，每一层的权重更新同等对待。计算速度快+收敛速度快。
缺点：1、Dead Relu Problem问题：learning rate较大时，如果初始w分布是一个均值是0.1，方差较小的分布，那么激活函数的输入就是一个正值，BPTT时，由于learning rate大，可能会出现w变成一个均值是0.1，方差较小的分布，那么这时激活函数的输入就是一个负值，这就会导致梯度更新时梯度一直是0，w更新不了。2、Relu的输出不是zero-centered的

4、Prelu函数

$f(x)=max(\alpha x, x)$

α为0.01，这样就可以有效解决dead relu问题，因为梯度值不会为0了呀

5、ELU函数

$f(x)=x, x > 0 | \alpha (e^{x}-1), otherwise$

这样就可以解决zero-centered问题了，尽量时均值为0嘛，同时避免dead relu问题

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

大模型应用之路：从提示词到通用人工智能（AGI）

大模型在人工智能領域的應用正迅速擴展，從最初的提示詞（Prompt）工程到追求通用人工智能（AGI）的宏偉目標，這一旅程充滿了挑戰與創新。本文將探索大模型在實際應用中的進展，以及它們如何爲實現AGI鋪平道路。基於AI大模型的推理功能，結合

2024-06-14 11:54:14

数智教育创新如何向未来？腾讯云与你探索革新之路

引言隨着科技革命的快速發展，掀起教育領域的變革，新理念、新技術、新模式、新應用正不斷湧現，正塑造着教育的未來形態。未來科技還將如何賦能教育創新？ 5月31日，由騰訊雲TVP 與西安電子科技大學聯合舉辦的「數智教育的創新與技術融合

2024-06-14 11:45:25

AI大爆炸时代如何实现技术创作“开挂”？技术创作特训营第二期，限时报名赢好礼

在這個由人工智能引領的創作大爆炸時代，每一位創作者都有機會成爲自己故事的主宰。開發者們擁有豐富的技術知識和經驗，擁有照亮他人、引領時代的潛力。與此同時，近年來 AIGC 工具爆發式增長，技術創作者面臨的機遇與挑戰被加倍放大。工具眼花繚亂，反

2024-06-14 11:45:21

首批！华为云盘古研发大模型通过代码大模型评估，获当前最高等级

本文分享自華爲雲社區《首批！華爲雲盤古研發大模型通過代碼大模型評估，獲當前最高等級》，作者：華爲雲頭條。近日，在中國信通院組織的首輪代碼大模型評估中，華爲技術有限公司的華爲雲盤古研發大模型最終獲得4+級，成爲國內首批通過該項評估的企業之

2024-06-13 10:57:02

BCS2024｜Baidu Comate：以研发提效为驱动实现“安全左移”

2024年6月5日，以“AI驅動安全”爲主題的2024全球數字經濟大會數字安全高層論壇暨北京網絡安全大會戰略峯會（簡稱“BCS大會”）在北京國家會議中心開幕。 BCS2024｜“互聯網創新發展”論壇百度研發安全負責人陳長林出席互聯網創

2024-06-08 09:41:40

低代码：加速企业数字化转型的利器

隨着企業數字化轉型步伐的加快，低代碼開發平臺迅速成爲市場的焦點。**憑藉其能簡化開發流程、縮短交付時間和降低成本等優勢，**低代碼已經贏得了企業和開發人員的廣泛認可，已成爲推動企業數字化轉型、提高企業創新效率、競爭力的關鍵工具。本文將詳細介

2024-06-07 21:18:49

原来Stable Diffusion是这样工作的

stable diffusion是一種潛在擴散模型，可以從文本生成人工智能圖像。爲什麼叫做潛在擴散模型呢？這是因爲與在高維圖像空間中操作不同，它首先將圖像壓縮到潛在空間中，然後再進行操作。在這篇文章中，我們將深入瞭解它到底是如何工作的,還

2024-06-06 21:38:48

企业实施数字化转型有哪些方面？

本人研究企業數字化轉型10餘年，爲企業軟件選型、數字化提供諮詢服務！目前重點研究低代碼數字化轉型玩法，力爭爲各行各業探索出一條最具性價比的數字化方式。關於“企業數字化轉型包括哪些方面”這個問題，咱先來看個例子哈~ 比如說某製造企業通過數

2024-06-06 21:27:46

首批！Zilliz 获得亚马逊云科技生成式 AI 合作伙伴能力认证

Zilliz 正式宣佈通過亞馬遜雲科技生成式 AI 能力認證！這一認證不僅肯定了 Zilliz 在人工智能和非結構化數據領域的卓越能力，也標誌着 Zilliz 在推動 AI 技術創新和應用的道路上邁出了重要一步。亞馬遜雲科技生

2024-06-06 14:16:04

度安讲 * 第二期「安全左移·业务护航」技术沙龙成功举办

當下，“安全左移”作爲落地DevSecOps的重要實踐之一，已在業界達成共識。DevSecOps作爲一種集開發、安全、運維於一體的軟件開發和運營模式，強調在敏捷交付下，“安全”在軟件開發生命週期的全覆蓋貫穿和核心位置。所謂“安全左移”，與

2024-06-03 21:42:25

向量数据库引领 AI 创新——Zilliz 亮相 2024 亚马逊云科技中国峰会

2024年5月29日，亞馬遜雲科技中國峯會在上海召開，此次峯會聚集了來自全球各地的科技領袖、行業專家和創新企業，探討雲計算、大數據、人工智能等前沿技術的發展趨勢和應用場景。作爲領先的向量數據庫技術公司，Zilliz 在本次峯會上展示了最新的

2024-05-30 21:25:17

2024年国内最全面最前沿人工智能理论和实践资料

引言【導讀】2024第11屆全球互聯網架構大會圓滿結束。會議邀請了100餘位行業內的領軍人物和革新者，大會通過主題演講、實踐案例分享，以及前瞻性的技術討論，探索AI技術的邊界。(最新AI-大模型獲取地址點擊領取) 近日

2024-05-29 22:52:52

AI安全志：英国AI骗保事件增加300%！

最近，英國《衛報》報道稱，一些騙子正在利用人工智能照片編輯軟件篡改照片，以進行保險欺詐活動。這一發現令保險公司震驚，因爲這可能導致汽車保險費用飆升至歷史最高水平。安聯保險公司表示，從2021年至2023年期間，利用應用程序篡

2024-05-28 00:15:50

使用 Spring Cloud Alibaba AI 构建 RAG 应用

作者：姬世文背景介紹 RAG（Retrieval Augmented Generation）檢索增強生成（RAG）是一種用於將數據與人工智能模型集成的技術。在 RAG 工作流程中，第一步將文檔數據加載到矢量數據庫（例如 Redis）中。

2024-05-27 21:13:51

面向AI的开发：从大模型（LLM）、检索增强生成（RAG）到智能体（Agent）的应用

引言隨着人工智能技術的飛速發展，大型語言模型（LLM）、檢索增強生成（RAG）和智能體（Agent）已經成爲推動該領域進步的關鍵技術，這些技術不僅改變了我們與機器的交互方式，而且爲各種應用和服務的開發提供了前所未有的可能性。正確理解這三者

2024-05-24 23:57:39

24小時熱門文章

最新文章

最新評論文章