DeepLearning Good Blogs!

原創

2020-02-21 09:31

目錄

深度學習基礎

深度學習中的重要工作

BatchNorm

Attention

深度學習應用技巧

科研建議、科研工具

此博客用於積累一些優秀的博客和文章，持續更新。

深度學習基礎

數學知識

矩陣求導術（上）主要介紹標量對矩陣的求導。
矩陣求導術（下）主要介紹矩陣對矩陣的求導。
這兩篇文章非常值得一讀，值得動筆一算！

深度學習知識

自學大禮包

CV開發者自我修養 | 吳恩達教程/筆記/刷題資料最全彙總

L1與L2損失函數和正則化的區別

英文原文：Differences between L1 and L2 as Loss Function and Regularization
中文翻譯：L1與L2損失函數和正則化的區別

正則化

深度學習中的重要工作

ResNet

對ResNet的理解
從多人投票系統的角度解讀，“ResNet的深度並沒有很深”。
極深網絡（ResNet/DenseNet）: Skip Connection爲何有效及其它
爲什麼ResNet和DenseNet可以這麼深？一文詳解殘差塊爲何有助於解決梯度彌散問題。

Normalization

BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm簡介

BatchNorm

深度學習中 Batch Normalization爲什麼效果好？
知乎上關於BN的一個問題，其中魏秀參的回答第4點，我不壞的回答中的數學解釋非常好。
Pytorch中的Batch Normalization layer踩坑
特別是關於凍結BN的寫法。

Attention

深度學習應用技巧

網絡調試

筆記之Troubleshooting Deep Neural Networks
比較general的網絡調試調參思路介紹，是一篇英文keynote的翻譯版本，原文見Troubleshooting Deep Neural Networks
Andrej Karpathy的一篇推特及其評論區
提供了一些常見的調參思路，還有可能會犯的錯誤。我總結了一下寫了一篇博客：神經網絡常見錯誤（Most Common Neural Net Mistakes）
Common causes of nans during training
stackoverflow上的一篇回答，列出了一些訓練過程中出現的NaN的常見情況，包括學習率，學習率更新策略，損失函數，輸入數據，BatchNorm等多個方面。
警惕！損失Loss爲Nan或者超級大的原因
談談深度學習中的 Batch_Size
探討batch size對網絡表現的影響。

顯存計算

淺談深度學習:如何計算模型以及中間變量的顯存佔用大小
詳細介紹了模型佔用顯存的來源和計算方法。
如何在Pytorch中精細化利用顯存
講解了如何利用Pytorch深度學習框架的一些特性，查看當前使用的變量所佔用的顯存大小，以及一些優化工作。
再次淺談Pytorch中的顯存利用問題(附完善顯存跟蹤代碼)
博主分析了Pytorch-Memory-Utils這個工具來檢測在訓練過程中關於顯存的變化情況，分析如何正確釋放多餘的顯存。

損失函數

Pytorch中Balance binary cross entropy損失函數的寫法
在正負樣本不平均的時候有效，該文章提供了一種寫法。

PyTorch

PyTorch 有哪些坑/bug？ - 知乎
高贊回答中提到的常見問題：cudnn的bug（高斯定理的回答），distributed 的坑（KAIZ的回答），數據類型轉換的注意點（小磊的回答），動態圖的坑（陳誠的回答），其他一些總結（御宅暴君的回答）…
pytorch指定層凍結。初始化權重
訓練特定層，凍結其它層的四個應用場景寫的非常好。
pytorch 多GPU訓練總結（DataParallel的使用）
兩部分內容：多gpu官方思路有張圖，解決多GPU 負載不均衡的問題做法。
一文弄懂Pytorch的DataLoader, DataSet, Sampler之間的關係
寫的非常好，以後寫源碼分析就可以參考這篇的思路。

科研建議、科研工具

科研大牛們怎麼讀文獻？

發佈了25 篇原創文章 · 獲贊 18 · 訪問量 4萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Create 2024 分論壇：百度大模型安全解決方案護航開發者一起創造未來

4月16日，百度Create AI開發者大會在深圳國際會展中心（寶安）舉行，大會以“創造未來”爲主題，匯聚了當前科技和產業革命中的開發者先鋒力量。自去年3月16日發佈知識增強大語言模型文心一言以來，百度不斷推動文心大模型的升級迭代，每一次版

2024-04-19 21:33:25

AI大模型應用架構（ALLMA）白皮書解讀

隨着人工智能技術的不斷髮展，AI大模型成爲推動生產、生活方式變革，助推產業智能化轉型升級，驅動數字經濟高質量發展等社會經濟發展方面的新引擎。爲了全面展示AI大模型的發展全貌，爲各界提供新思路，本文將對AI大模型應用架構（ALLMA）白皮書進

2024-04-19 11:29:39

文心大模型ERNIE-Tiny：輕量化技術的全面解讀

隨着人工智能技術的日益成熟，大模型成爲了衆多領域的研究熱點。大模型通過龐大的數據量和複雜的網絡結構，實現了對數據的深度挖掘和高效處理。然而，大模型的龐大體積和高計算成本也限制了其在一些實際場景中的應用。爲了解決這一問題，文心大模型ERNIE

2024-04-18 11:29:53

文檔圖像大模型

隨着信息技術的快速發展，文檔處理已經成爲日常生活和工作中不可或缺的一部分。傳統的文檔處理方法往往需要人工參與，效率低下且易出錯。近年來，隨着深度學習技術的突破，文檔圖像大模型在智能文檔處理領域嶄露頭角，爲提升文檔處理性能提供了新的解決方案。

2024-04-18 11:29:52

王海峯：百度 500 萬 AI 人才培養目標已提前達成

4 月 16 日，以“創造未來”爲主題的 Create 2024 百度 AI 開發者大會在深圳國際會展中心成功舉辦。百度首席技術官王海峯以“技術築基，星河璀璨”爲題，發表演講，解讀了智能體、代碼、多模型等多項文心大模型的關鍵技術和最新進展。

2024-04-17 23:41:11

提高 RAG 應用準確度，時下流行的 Reranker 瞭解一下？

檢索增強生成（RAG）是一種新興的 AI 技術棧，通過爲大型語言模型（LLM）提供額外的“最新知識”來增強其能力。基本的 RAG 應用包括四個關鍵技術組成部分： Embedding 模型：用於將外部文檔和用戶查詢轉換成 Embeddi

2024-04-17 21:20:19

從零開始學習大模型

隨着人工智能技術的快速發展，大模型已成爲許多領域的熱門話題。然而，大模型的創建並不是一件容易的事情。在本文中，我們將從零開始學習如何創建一個大模型，幫助讀者掌握大模型的創建過程。一、數據收集創建大模型的首要任務是收集數據。數據是大模型的

2024-04-16 11:29:26

倒計時4天！百度Create AI開發者大會“大模型與深度學習技術”論壇亮點搶鮮看！

作爲人工智能的核心基礎技術，深度學習具有很強的通用性，大模型技術在深度學習的基礎上，通過構建更加龐大神經網絡模型和應用transformer等更加領先的算法，使模型的處理能力產生質的飛躍。飛槳（PaddlePaddle）以百度多年的深度學習

2024-04-12 21:33:07

智能Java開發工具IntelliJ IDEA v2024.1震撼發佈——讓開發工作更簡單！

IntelliJ IDEA，是java編程語言開發的集成環境。IntelliJ在業界被公認爲最好的java開發工具，尤其在智能代碼助手、代碼自動提示、重構、JavaEE支持、各類版本工具(git、svn等)、JUnit、CVS整合、代碼分析

2024-04-12 11:33:56

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

金融領域中的大模型Lora微調：實戰應用與性能優化

隨着金融行業的快速發展，大數據和人工智能技術的應用越來越廣泛。在這個背景下，深度學習模型在金融領域的應用逐漸受到重視。然而，傳統的深度學習模型在金融場景中面臨着數據量大、模型複雜度高、計算資源有限等挑戰。爲了解決這個問題，Lora框架應運而

2024-04-11 23:28:47

大模型分佈式訓練並行技術

隨着深度學習的發展，模型規模逐漸增大，數據量和計算需求也呈爆炸式增長。在單個計算設備上完成大模型的訓練變得不切實際，因此，分佈式訓練成爲了解決這一問題的關鍵。在分佈式訓練中，數據並行是一種非常有效的策略，通過將數據和計算任務分佈到多個計算設

2024-04-10 23:29:41

智能製造與AI大模型

隨着科技的飛速發展，人工智能（AI）已經滲透到我們生活的方方面面，尤其在製造業中，AI大模型的應用正在改變着傳統的生產模式。本文將探討AI大模型在智能製造領域的應用，以及它如何成爲提升生產力的關鍵力量。首先，AI大模型爲智能製造提供了強大

2024-04-10 23:29:40

Stable diffusion 初學者指南

1. Stable diffusion 初學者指南想掌握Stable Diffusion AI技術嗎？這份初學者指南專爲完全沒接觸過Stable Diffusion或任何AI圖像生成器的新手設計。跟隨本指南，你將瞭解Stable Dif

2024-04-09 21:30:37

開源語言大模型

隨着人工智能技術的快速發展，開源語言大模型在各個領域的應用越來越廣泛。但是，如何正確選擇和應用開源語言大模型，以及如何在實踐中避免常見錯誤，對於很多初學者來說仍然是一個挑戰。本文將帶您走進開源語言大模型的世界，探索其原理、選擇、應用以及實踐

2024-04-08 11:31:14

24小時熱門文章

最新文章

最新評論文章