網絡模型小型化--量化

原創

终身幼儿园

2020-05-14 14:58

網絡模型量化

模型量化

以更少位數的數據類型用於近似表示32位有限範圍浮點型數據的過程

模型的輸入輸出依然是浮點型

達到減少模型尺寸大小、減少模型內存消耗及加快模型推理速度等目標

原理

模型量化橋接了定點與浮點，建立了一種有效的數據映射關係，使得以較小的精度損失代價獲得了較好的收益
由浮點到定點的量化
由定點到浮點反量化

優缺點

好處

減小模型尺寸，如8位整型量化可減少75%的模型大小
減少存儲空間，在邊緣側存儲空間不足時更具有意義
易於在線升級，模型更小意味着更加容易傳輸
減少內存耗用，更小的模型大小意味着不需要更多的內存
加快推理速度，訪問一次32位浮點型可以訪問四次int8整型，整型運算比浮點型運算更快
減少設備功耗，內存耗用少了推理速度快了自然減少了設備功耗
支持微處理器，有些微處理器屬於8位的，低功耗運行浮點運算速度慢，需要進行8bit量化

缺點

模型量化增加了操作複雜度，在量化時需要做一些特殊的處理，否則精度損失更嚴重
模型量化會損失一定的精度，雖然在微調後可以減少精度損失，但推理精度確實下降

TF模型的兩類量化方式

針對已經訓練好的模型進行量化

TensorFlow Lite converter
TensorFlow Lite Optimizing COnverter（toco命令工具）
需要結合業務場景及所擁有的硬件資源選擇量化的方式，目的是以最小損失達到最大化模型量化效果
訓練後量化幾種方案
- 混合量化–僅量化權重
  - 浮點型的權重量化爲int8整型，可將模型大小直接減少75%、提升推理速度最大3倍
  - 推理的過程中，需要將int8量化值反量化爲浮點型後再進行計算
  - 如果某些Ops不支持int8整型量化，那麼其保存的權重依然是浮點型的
- 全整型量化–權重和激活值都進行量化
  - 試圖將權重、激活值及輸入值均全部做int8量化，並且將所有模型運算操作置於int8下進行執行，以達到最好的量化效果
  - 需要一個具有代表性的小數據集，用於統計激活值和輸入值等的浮點型範圍，以便進行精準量化
- 半精度float16量化–僅量化權重
  - 將權重量化爲半精度float16形式，其可以減少一半的模型大小、相比於int8更小的精度損失
  - 如果硬件支持float16計算的話那麼其效果更佳
  - 在CPU運行時，半精度量化也需要像int8量化一樣進行反量化到float32在進行計算
  - GPU可以支持float16運算

TF量化感知訓練（Quantization-aware training）

僞量化的過程
在可識別的某些操作內嵌入僞量化節點（fake quantization nodes）
- 用以統計訓練時流經該節點數據的最大最小值，便於在使用TOCO轉換tflite格式時量化使用並減少精度損失
- 需要對訓練和推理過程添加代碼
  - 第一步，在訓練圖結構內添加僞量化節點
  - 第二步，重寫推理圖結構並保存爲新的模型
  - 第三步，轉換模型爲全量化模型

兩種方式的有缺點比較

兩者均可達到模型量化的作用
兩者的推理工作原理是一樣的
兩者都可工作在Tensorflow lite推理框架下並進行相應加速
訓練後量化工作量稍微簡單些，而量化感知訓練工作量更繁瑣一些
量化感知訓練比訓練後量化損失的精度更少，官方推薦使用量化感知訓練方式

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

HTML頁面關於高分屏的設置

記錄一個HTML頁面關於高分屏的踩到的坑。所謂高分屏，就是在同樣大小的屏幕面積上顯示更多的像素點，這樣可以呈現更好的可視效果的屏幕。例如，我的筆記本是15.6寸，理論上它的屏幕分辨率應該是1920 x 1080像素，但實際上我的筆記本屏幕

2024-05-04 14:31:10

DAPPER 事務 TRANSACTION

https://www.cnblogs.com/friend/p/16754184.html\ public async Task<int> Save(long moldProducedProductId, List<MoldStan

2024-05-04 14:29:20

[MDP.AspNetCore] 實作OAuth協定SSO Server/Client專案範例

團隊負責的系統變多的時候，使用SSO Server提供統一身分驗證，讓團隊只需要維護一份用戶資料及一個身分驗證服務。除了減少團隊維護成本之外，也讓使用者不用記憶多個站臺的帳號密碼，提供更好的使用者體驗。本篇文章，介紹使用MDP.AspNe

2024-05-04 14:23:49

Redis官方開源的可視化管理工具 - RedisInsight

前言今天大姚給大家推薦一款Redis官方開源的可視化管理工具：RedisInsight。 Redis介紹 Redis (Remote Dictionary Server) 是一個使用 C 語言編寫的，開源的 (遵守 BSD 協議) 高性

2024-05-04 14:21:49

Python 潮流週刊#49：谷歌裁員 Python 團隊，微軟開源 MS-DOS 4.0

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-05-04 14:19:09

HarmonyOS 垂直方向內容滾動條實現

概述 Swiper組件是一個用戶界面元素，用於在垂直方向上滾動內容。它通過遍歷一個數據集合，爲每一項創建一個可滾動的文本項。代碼實現以下是Swiper組件的實現代碼： Swiper(){ ForEach(searchSwiper,

2024-05-04 14:05:08

基於SSM的倉庫進銷存系統畢業設計論文【範文】

摘要隨着信息技術的不斷髮展，企業對於倉儲管理的要求日益提高。爲了提升倉庫管理的自動化和智能化水平，本研究設計並實現了一個基於Spring、Spring MVC和MyBatis (SSM) 框架的在倉庫進銷存系統。該系統旨在爲企業提供一個高

2024-05-04 14:03:17

基於SSM的在線考試系統畢業設計論文【範文】

摘要隨着信息技術的飛速發展，網絡教學逐漸成爲教育行業的重要組成部分。在線考試系統作爲網絡教學平臺的關鍵模塊之一，其便捷性、高效性和公正性受到廣泛關注，基於SSM框架的在線考試系統旨在提供一個穩定、可靠並且易於維護的在線考試環境，以滿足現代

2024-05-04 14:03:17

CSS & JS Effect – 用 wheel 模擬 scroll

前言在用 JavaScript 實現 position sticky 文章中，我提到了用 wheel 來模擬 scroll 效果。這篇來說說具體怎麼實現，挺簡單的哦。 Preparation table.html <div c

2024-05-04 13:59:16

python包：torchsummary

利用torchsummary觀察每一層的情況 1）按照方式 pip install torchsummary 2）

2024-05-04 13:56:56

Windows使用WSL2及docker(Ubuntu22.04 LTS)

WSL2初始化 1.換源 #1 cp /etc/apt/sources.list /etc/apt/sources.list.bak #2 vim /etc/apt/sources.list # 清空原源並替換成以下源 # deb-src

臨冬城城主

2024-05-04 13:52:56

學習Mysql 你應該懂得

1、日誌系統：平時在設計系統時可以借鑑一下參考下面文章 https://www.cnblogs.com/ScarecrowAnBird/p/18163444 2、索引：提高性能利器 3、鎖：提高併發能力小絕招 https://ww

落葉已歸根

2024-05-04 13:45:25

mysql 鎖，和加鎖機制

背景間隙鎖是MySQL在RR可重複讀隔離級別下用來修復幻讀才引入的一種鎖，間隙鎖也只有在RR可重複讀隔離級別下才會存在，如果是在RC讀已提交隔離級別下，是沒有間隙鎖的存在的。另外，我們也知道，幻讀這種現象也只有在當前讀的時候纔會發生，在一致

落葉已歸根

2024-05-04 13:45:25

深入 Django 模型層：數據庫設計與 ORM 實踐指南

title: 深入 Django 模型層：數據庫設計與 ORM 實踐指南 date: 2024/5/3 18:25:33 updated: 2024/5/3 18:25:33 categories: 後端開發 tags: Djang

2024-05-04 13:38:24

[轉帖]Introducing Exadata Cloud@Customer X10M

https://blogs.oracle.com/database/post/introducing-exadata-cloudcustomer-x10m Extreme Scale with Dramatically

濟南小老虎

2024-05-04 13:29:33

24小時熱門文章

druid數據源 xml配置

最新文章

最新評論文章