文献阅读（20）

原創

tiaozhanzhe1900

2020-06-29 02:29

文章目录

题目：HAQ: Hardware-Aware Automated Quantization with Mixed Precision
时间：2019
会议：IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
研究机构：韩松
github: https://github.com/mit-han-lab/haq-release

他引用的论文
A scalable bit-serial matrix multiplication overlay for reconfigurable computing
Bit fusion: Bit-level dynamically composable architecture for accelerating deep neural network
Netadapt: Platform-aware neural network adaptation for mobile applications

1 abstract & introduction &related work

确定每层网络的量化位宽，设计空间过大

H：硬件平台数量
M：M个网络模型
N：一个网络有N层
假设每层网络weight和activation的位宽是1-8bit之间，则可能性有 $O(H*M*8^{2N})$ 种

人工定点化时一些的规律：

第一层和最后一层位数多一点
卷积层更敏感，位宽要比全连接层多

本篇论文的贡献：

自动化的Hardware-Aware Automated Quantization (HAQ) framework
硬件可以直接反馈
强化学习采用了deep deterministic policy gradient

related work

quantization
autoML
efficient model

2 approach

2.1 observation(state space)

这里定义了状态，分成卷积层和全连接层

2.2 action space

一旦硬件的指标不满足，就会降低每层的位宽来满足限制

2.3 硬件的直接反馈

2.4 量化

就是正常的量化策略，先截断，再就近取数
本篇论文的量化可以分成三种：

延时限制的量化
能耗限制的量化
模型大小限制的量化

2.5 reward function奖励函数

奖励函数只跟准确率有关

2.6 agent

利用了这个算法deep deterministic policy gradient(DDPG)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

文献阅读（82）

文章目錄1 abstract & introduction2 Clamping Rectified Linear Unit3 量化方法3.1 前向近似3.2 後向近似題目：Efficient Quantization for

tiaozhanzhe1900

2020-07-07 23:49:18

文献阅读（59）

文章目錄1 縮寫 & 引用2 abstract & introduction3 神經網絡的比特級稀疏性4 Laconic 題目：Laconic Deep Learning Inference Acceleration 時間：20

tiaozhanzhe1900

2020-06-29 02:29:52

文献阅读（50）

文章目錄1 縮寫 & 引用2 abstract & introduction3 硬件架構3.1 計算單元3.2 Xbar interconnect3.3 流緩衝區和filter caches4 圖編譯器4.1 切分4.2 存儲分配

tiaozhanzhe1900

2020-06-29 02:29:52

文献阅读（70）

文章目錄1 縮寫 & 引用2 abstract & introduction1 縮寫 & 引用2 abstract & introduction3 相關工作4 低階近似和通道剪枝的結合4.1 基於SVD的低階近似4.2 泰勒剪枝4

tiaozhanzhe1900

2020-06-29 02:29:52

文献笔记（4）(2018ISSCC 13.3)

文章目錄1 英文縮寫2 overall architecture1 縮寫&引用2 abstract & introduction3 overall硬件結構4 workload mapping on unified DNN core

tiaozhanzhe1900

2020-06-29 02:29:52

文献阅读（91）

文章目錄1 縮寫 & 引用2 abstract & introduction3 相關工作4 方法論4.1 構建一個over-parameterized網絡3.2 二值化的path3.3 基於硬件的latency3.4 基於強化學習

tiaozhanzhe1900

2020-06-29 02:29:42

文献阅读（69）

文章目錄1 縮寫 & 引用2 abstract & introduction3 提出的方法3.1 稀疏度的定義3.2 layer-wise polishment(LWP)3.3 梯度優化4 實驗結果4.1 layer-wise

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（73）

文章目錄1 縮寫 & 引用2 abstract & introduction3 提出的架構3.1 PE架構4 數據流5 實現結果題目：Convolutional Neural Network Accelerator with

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（57）

文章目錄1 縮寫 & 引用2 abstract & introduction3 細粒度混合精度4 稀疏深度學習計算單元5 跳零MAC運算6 輸入負載平衡題目：An Energy-Efficient Sparse Deep-Ne

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（76）

文章目錄1 abstract & introduction2 網絡設計2.1 ShuffleNetV22.2 網絡主要的改進2.3 網絡量化3 accelerator結構3.1 軟件接口題目：Synetgy: Algorith

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（60）

文章目錄1 縮寫&引用2 abstract & introduction3 background & related work4 addnet可配置乘法器4.1 可配置乘法器4.2 FPGA乘法器映射4.3 架構5 addnet訓

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（63）

文章目錄1 縮寫 & 引用2 abstract & introduction3 零權重skip3.1 權重lookahead3.2 權重lookaside3.3 硬件連接和軟件影響題目：Bit-Tactical: A Soft

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（61）

文章目錄1 縮寫 & 引用2 abstract & introduction3 方法論3.1 通用的基於LUT的有常數乘法4 run-time可配置的CNN卷積核架構4.1 通用架構4.2 faithfully rounded S

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（74）

文章目錄1 縮寫 & 引用2 abstract & introduction3 背景3.1 餘數系統3.2 壓縮算法3.3 相關工作4 提出的架構題目：Res-DNN: A Residue Number System-Base

tiaozhanzhe1900

2020-06-29 02:29:41

文献阅读（37）

文章目錄1 縮寫 & 引用2 abstract & introduction3 前端設計方法3.1 背景3.2 OOHLS overview3.3 latency insensitive(LI) channels3.4 Match

tiaozhanzhe1900

2020-06-29 02:29:41

24小時熱門文章

最新文章

最新評論文章