文獻閱讀（20）

原創

tiaozhanzhe1900

2020-06-29 02:29

文章目錄

題目：HAQ: Hardware-Aware Automated Quantization with Mixed Precision
時間：2019
會議：IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
研究機構：韓松
github: https://github.com/mit-han-lab/haq-release

他引用的論文
A scalable bit-serial matrix multiplication overlay for reconfigurable computing
Bit fusion: Bit-level dynamically composable architecture for accelerating deep neural network
Netadapt: Platform-aware neural network adaptation for mobile applications

1 abstract & introduction &related work

確定每層網絡的量化位寬，設計空間過大

H：硬件平臺數量
M：M個網絡模型
N：一個網絡有N層
假設每層網絡weight和activation的位寬是1-8bit之間，則可能性有 $O(H*M*8^{2N})$ 種

人工定點化時一些的規律：

第一層和最後一層位數多一點
卷積層更敏感，位寬要比全連接層多

本篇論文的貢獻：

自動化的Hardware-Aware Automated Quantization (HAQ) framework
硬件可以直接反饋
強化學習採用了deep deterministic policy gradient

related work

quantization
autoML
efficient model

2 approach

2.1 observation(state space)

這裏定義了狀態，分成卷積層和全連接層

2.2 action space

一旦硬件的指標不滿足，就會降低每層的位寬來滿足限制

2.3 硬件的直接反饋

2.4 量化

就是正常的量化策略，先截斷，再就近取數
本篇論文的量化可以分成三種：

延時限制的量化
能耗限制的量化
模型大小限制的量化

2.5 reward function獎勵函數

獎勵函數只跟準確率有關

2.6 agent

利用了這個算法deep deterministic policy gradient(DDPG)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

文獻閱讀（82）

文章目錄1 abstract & introduction2 Clamping Rectified Linear Unit3 量化方法3.1 前向近似3.2 後向近似題目：Efficient Quantization for

tiaozhanzhe1900

2020-07-07 23:49:18

文獻閱讀（59）

文章目錄1 縮寫 & 引用2 abstract & introduction3 神經網絡的比特級稀疏性4 Laconic 題目：Laconic Deep Learning Inference Acceleration 時間：20

tiaozhanzhe1900

2020-06-29 02:29:52

文獻閱讀（50）

文章目錄1 縮寫 & 引用2 abstract & introduction3 硬件架構3.1 計算單元3.2 Xbar interconnect3.3 流緩衝區和filter caches4 圖編譯器4.1 切分4.2 存儲分配

tiaozhanzhe1900

2020-06-29 02:29:52

文獻閱讀（70）

文章目錄1 縮寫 & 引用2 abstract & introduction1 縮寫 & 引用2 abstract & introduction3 相關工作4 低階近似和通道剪枝的結合4.1 基於SVD的低階近似4.2 泰勒剪枝4

tiaozhanzhe1900

2020-06-29 02:29:52

文獻筆記（4）(2018ISSCC 13.3)

文章目錄1 英文縮寫2 overall architecture1 縮寫&引用2 abstract & introduction3 overall硬件結構4 workload mapping on unified DNN core

tiaozhanzhe1900

2020-06-29 02:29:52

文獻閱讀（91）

文章目錄1 縮寫 & 引用2 abstract & introduction3 相關工作4 方法論4.1 構建一個over-parameterized網絡3.2 二值化的path3.3 基於硬件的latency3.4 基於強化學習

tiaozhanzhe1900

2020-06-29 02:29:42

文獻閱讀（69）

文章目錄1 縮寫 & 引用2 abstract & introduction3 提出的方法3.1 稀疏度的定義3.2 layer-wise polishment(LWP)3.3 梯度優化4 實驗結果4.1 layer-wise

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（73）

文章目錄1 縮寫 & 引用2 abstract & introduction3 提出的架構3.1 PE架構4 數據流5 實現結果題目：Convolutional Neural Network Accelerator with

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（57）

文章目錄1 縮寫 & 引用2 abstract & introduction3 細粒度混合精度4 稀疏深度學習計算單元5 跳零MAC運算6 輸入負載平衡題目：An Energy-Efficient Sparse Deep-Ne

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（76）

文章目錄1 abstract & introduction2 網絡設計2.1 ShuffleNetV22.2 網絡主要的改進2.3 網絡量化3 accelerator結構3.1 軟件接口題目：Synetgy: Algorith

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（60）

文章目錄1 縮寫&引用2 abstract & introduction3 background & related work4 addnet可配置乘法器4.1 可配置乘法器4.2 FPGA乘法器映射4.3 架構5 addnet訓

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（63）

文章目錄1 縮寫 & 引用2 abstract & introduction3 零權重skip3.1 權重lookahead3.2 權重lookaside3.3 硬件連接和軟件影響題目：Bit-Tactical: A Soft

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（61）

文章目錄1 縮寫 & 引用2 abstract & introduction3 方法論3.1 通用的基於LUT的有常數乘法4 run-time可配置的CNN卷積核架構4.1 通用架構4.2 faithfully rounded S

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（74）

文章目錄1 縮寫 & 引用2 abstract & introduction3 背景3.1 餘數系統3.2 壓縮算法3.3 相關工作4 提出的架構題目：Res-DNN: A Residue Number System-Base

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（37）

文章目錄1 縮寫 & 引用2 abstract & introduction3 前端設計方法3.1 背景3.2 OOHLS overview3.3 latency insensitive(LI) channels3.4 Match

tiaozhanzhe1900

2020-06-29 02:29:41

24小時熱門文章

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

最新文章

最新評論文章