大模型如何輕量化訓練和部署是非常重要的問題.
相關論文也需要學習.
第一篇我就寫這裏.
8-BIT OPTIMIZERS VIA BLOCK-WISE QUANTIZATION
1. 基本知識:
1.1狀態優化器
一個優化器在迭代第t次時候更新神經網絡參數w的公式爲:
. L是損失函數.
大模型如何輕量化訓練和部署是非常重要的問題.
相關論文也需要學習.
第一篇我就寫這裏.
8-BIT OPTIMIZERS VIA BLOCK-WISE QUANTIZATION
1. 基本知識:
1.1狀態優化器
一個優化器在迭代第t次時候更新神經網絡參數w的公式爲:
. L是損失函數.
在github裏面下載PaddleOCR源碼後,接下來開始一一安裝: 1、安裝Python,此處必須安裝3.8--3.10的版本,3.11版本目前是不支持的,容易報錯。 2、依次安裝