工程之道，曠視MegEngine工業級模型量化能力的構建與實戰

原創

旷视研究院

2020-08-28 13:04

MegEngine 提供從訓練到部署完整的量化支持，包括量化感知訓練以及訓練後量化，憑藉“訓練推理一體”的特性，MegEngine更能保證量化之後的模型與部署之後的效果一致。本文將簡要介紹神經網絡量化的原理，並與大家分享MegEngine量化方面的設計思路與實操教程。

背景

近年來隨着邊緣計算和物聯網的興起與發展，許多移動終端（比如手機）成爲了深度學習應用的承載平臺，甚至出現了各式各樣專用的神經網絡計算芯片。由於這些設備往往對計算資源和能耗有較大限制，因此在高性能服務器上訓練得到的神經網絡模型需要進行裁剪以縮小內存佔用、提升計算速度後，才能較好地在這些平臺上運行。

一種最直觀的裁剪方式就是用更少位數的數值類型來存儲網絡參數，比如常見的做法是將 32 位浮點數模型轉換成 8 位整數模型，模型大小減少爲 1/4，而運行在特定的設備上其計算速度也能提升爲 2~4 倍，這種模型轉換方式叫做量化（Quantization）。

量化的目的是爲了追求極致的推理計算速度，爲此捨棄了數值表示的精度，直覺上會帶來較大的模型掉點，但是在使用一系列精細的量化處理之後，其在推理時的掉點可以變得微乎其微，並能支持正常的部署應用。

原理

實現量化的算法多種多樣，一般按照代價從低到高可以分爲以下四種：

原文鏈接:【https://www.infoq.cn/article/B6IRpefL09cPy5GKh0Xd】。未經作者許可，禁止轉載。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

從零開始學習大模型

隨着人工智能技術的快速發展，大模型已成爲許多領域的熱門話題。然而，大模型的創建並不是一件容易的事情。在本文中，我們將從零開始學習如何創建一個大模型，幫助讀者掌握大模型的創建過程。一、數據收集創建大模型的首要任務是收集數據。數據是大模型的

2024-04-16 11:29:26

倒計時4天！百度Create AI開發者大會“大模型與深度學習技術”論壇亮點搶鮮看！

作爲人工智能的核心基礎技術，深度學習具有很強的通用性，大模型技術在深度學習的基礎上，通過構建更加龐大神經網絡模型和應用transformer等更加領先的算法，使模型的處理能力產生質的飛躍。飛槳（PaddlePaddle）以百度多年的深度學習

2024-04-12 21:33:07

智能Java開發工具IntelliJ IDEA v2024.1震撼發佈——讓開發工作更簡單！

IntelliJ IDEA，是java編程語言開發的集成環境。IntelliJ在業界被公認爲最好的java開發工具，尤其在智能代碼助手、代碼自動提示、重構、JavaEE支持、各類版本工具(git、svn等)、JUnit、CVS整合、代碼分析

2024-04-12 11:33:56

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

金融領域中的大模型Lora微調：實戰應用與性能優化

隨着金融行業的快速發展，大數據和人工智能技術的應用越來越廣泛。在這個背景下，深度學習模型在金融領域的應用逐漸受到重視。然而，傳統的深度學習模型在金融場景中面臨着數據量大、模型複雜度高、計算資源有限等挑戰。爲了解決這個問題，Lora框架應運而

2024-04-11 23:28:47

大模型分佈式訓練並行技術

隨着深度學習的發展，模型規模逐漸增大，數據量和計算需求也呈爆炸式增長。在單個計算設備上完成大模型的訓練變得不切實際，因此，分佈式訓練成爲了解決這一問題的關鍵。在分佈式訓練中，數據並行是一種非常有效的策略，通過將數據和計算任務分佈到多個計算設

2024-04-10 23:29:41

智能製造與AI大模型

隨着科技的飛速發展，人工智能（AI）已經滲透到我們生活的方方面面，尤其在製造業中，AI大模型的應用正在改變着傳統的生產模式。本文將探討AI大模型在智能製造領域的應用，以及它如何成爲提升生產力的關鍵力量。首先，AI大模型爲智能製造提供了強大

2024-04-10 23:29:40

Stable diffusion 初學者指南

1. Stable diffusion 初學者指南想掌握Stable Diffusion AI技術嗎？這份初學者指南專爲完全沒接觸過Stable Diffusion或任何AI圖像生成器的新手設計。跟隨本指南，你將瞭解Stable Dif

2024-04-09 21:30:37

開源語言大模型

隨着人工智能技術的快速發展，開源語言大模型在各個領域的應用越來越廣泛。但是，如何正確選擇和應用開源語言大模型，以及如何在實踐中避免常見錯誤，對於很多初學者來說仍然是一個挑戰。本文將帶您走進開源語言大模型的世界，探索其原理、選擇、應用以及實踐

2024-04-08 11:31:14

Coding and Paper Letter（八十八）

系列重啓之CPL。 1 Coding: 1.一個Python庫用來分析城市路網的工具箱，城市形態分析工具。 Madina 2.SkyPilot：在任何雲上運行 LLM、AI 和 Batch。通過簡單的界面即可實現最大程度的節省性能、最高

2024-04-08 00:55:47

百億大規模圖在廣告場景的應用

本文通過搜索推薦項目進行外賣搜索廣告弱供給填充，提高流量變現效率。我們提出外賣多場景異構大圖、異構大圖在線建模技術演進路線，解決外賣搜索推薦業務多渠道、即時化的挑戰。相關成果發表CIKM2023會議一篇。聯合機器學習平臺搭建大規模圖訓練、

2024-03-29 21:16:38

新體驗、高效能，星河零代碼產線加速帶動產業新質生產力

2023 年 12 月，在 Wave Summit+深度學習開發者大會上，飛槳隆重推出了端雲協同的低代碼開發工具——PaddleX。這款一站式 AI 開發工具集成了飛槳開發套件多年積累的模型訓練、推理全流程開發的優勢能力。同時立足產業真實應

2024-03-29 12:15:00

基於大模型與知識庫的Code Review實踐

在軟件開發過程中，Code Review是一項至關重要的活動，它有助於確保代碼質量、提高開發效率以及減少潛在的錯誤。隨着人工智能技術的發展，大模型與知識庫的結合爲Code Review帶來了新的可能性。本文將探討如何基於大模型與知識庫進行C

2024-03-29 11:59:33

文心千帆：從PPT製作到數字人主播，ERNIE-Bot|BLOOMZ大模型調優與RLHF訓練全攻略

隨着人工智能技術的不斷髮展，文心千帆作爲一款領先的人工智能模型，已經在多個領域展現出其強大的實力。無論是PPT製作，還是數字人主播，文心千帆都能夠爲用戶提供驚豔的應用體驗。而背後支撐這一切的，正是ERNIE-Bot|BLOOMZ大模型的強大

2024-03-29 00:01:17

利用“AI換臉”冒充的求職者越來越多，HR該怎麼發現

2022年7月，美國聯邦調查局互聯網犯罪投訴中心（IC3）發佈了一份新的公告，該公告警告說，越來越多的詐騙分子正在使用“深度僞造”技術在遠程職位面試中冒充求職者，騙取企業薪資、盜取企業的商業機密。新冠疫情推動遠程辦公普及。統

2024-03-28 12:32:00

24小時熱門文章

一個.NET開源的功能豐富、靈活易用的 Windows 窗口增強神器

最新文章

最新評論文章