混合精度訓練——資料+簡單說明

  • 最近看CDQA這個開源庫的時候看到了混合精度訓練這種寫法,所以簡單去了解了下,
  • 結果得出了一個很悲催的結論:我的小破筆記本的顯卡不支持混合精度訓練…??!
  • 自己不研究這個,找到一些很不錯的資料,自己看完後這裏就奉送上!

Tensor Core

-----------------------------大神自取-----------------------------
1. Deep Learning Performance Guide

2. 想讀讀PyTorch底層代碼?這份內核機制簡介送給你

3. 如何輕鬆瞭解深度學習模型中使用了混合精度?


  • 本着擴充知識的目的,我們來簡單普及一些關於顯卡的知識,雖然買不起…

GPU參數解釋

體現GPU計算能力的兩個重要特徵:
​ 1)CUDA核的個數;
​ 2)存儲器大小。
描述GPU性能的兩個重要指標:
​ 1)計算性能峯值;
​ 2)存儲器帶寬。

GPU,CUDA,cuDNN的理解

  • 略讀:

  • 補:cuDNN將研究人員創建和優化CUDA代碼以提高DL性能的需求抽象出來

GPU選擇(土豪自取)

GPU正篇

基於混和精度的模型加速

原始博文

  • 本這篇文章重在工程化,給出了具體的代碼以及下面的相應的參考資料,這幾份參考資料都很不錯,看完上面的博文,有需要可以仔細讀讀下面的資料

參考資料:

1.nv官方repo給了一些基於pytorch的apex加速的實現

2.nv官方關於混合精度優化的原理介紹

  • 按圖索驥,可以get到很多更加具體地內容。

3.低精度表示用於深度學習 訓練與推斷: pdf介紹,很不錯

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章