文獻閱讀（73）

原創

tiaozhanzhe1900

2020-06-29 02:29

文章目錄

3.1 PE架構

題目：Convolutional Neural Network Accelerator with Vector Quantization
時間：2019
會議：ISCAS
研究機構：國立臺灣大學
參考鏈接：https://blog.csdn.net/lishuiwang/article/details/78483547

1 縮寫 & 引用

Quantized cnn: a unified approach to accelerate and compress convolutional networks 2017 IEEE Transactions on Neural Networks and Learning Systems

2 abstract & introduction

本篇論文的主要貢獻：

提出了DNN壓縮方法：向量量化vector quantizaion
提出了accelerator，可以支持不同的codebook和kernel尺寸
cycle-accurate python model來估計模擬這種dataflow，估計所需的cycle數

3 提出的架構

首先矢量量化vector quantization需要將數據分成好幾個子空間，分割方法是每 $C_s'$ 個input channel分成一個子空間，比如下圖是按照 $C_s'=4$ 分割的

分割完子空間，每個子空間有一個codebook，有K個可能的權重矢量

3.1 PE架構

因爲有codebook，計算也可以通過查找表進行，所以PE計算流程分成預計算、dispatch、累加三步，預計算就是提前計算好查找表

4 數據流

數據流包括weight stationary、row stationary-like

5 實現結果

caffenet： $C_s'=4$ ， $K=128$
VGG-16： $C_s'=8$ ， $K=128$
只是綜合了，沒有流片，還通過一個週期準確的python模型來仿真週期數

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

文獻閱讀（82）

文章目錄1 abstract & introduction2 Clamping Rectified Linear Unit3 量化方法3.1 前向近似3.2 後向近似題目：Efficient Quantization for

tiaozhanzhe1900

2020-07-07 23:49:18

文獻閱讀（59）

文章目錄1 縮寫 & 引用2 abstract & introduction3 神經網絡的比特級稀疏性4 Laconic 題目：Laconic Deep Learning Inference Acceleration 時間：20

tiaozhanzhe1900

2020-06-29 02:29:52

文獻閱讀（50）

文章目錄1 縮寫 & 引用2 abstract & introduction3 硬件架構3.1 計算單元3.2 Xbar interconnect3.3 流緩衝區和filter caches4 圖編譯器4.1 切分4.2 存儲分配

tiaozhanzhe1900

2020-06-29 02:29:52

文獻閱讀（20）

文章目錄1 abstract & introduction &related work2 approach2.1 observation(state space)2.2 action space2.3 硬件的直接反饋2.4 量化2

tiaozhanzhe1900

2020-06-29 02:29:52

文獻閱讀（70）

文章目錄1 縮寫 & 引用2 abstract & introduction1 縮寫 & 引用2 abstract & introduction3 相關工作4 低階近似和通道剪枝的結合4.1 基於SVD的低階近似4.2 泰勒剪枝4

tiaozhanzhe1900

2020-06-29 02:29:52

文獻筆記（4）(2018ISSCC 13.3)

文章目錄1 英文縮寫2 overall architecture1 縮寫&引用2 abstract & introduction3 overall硬件結構4 workload mapping on unified DNN core

tiaozhanzhe1900

2020-06-29 02:29:52

文獻閱讀（91）

文章目錄1 縮寫 & 引用2 abstract & introduction3 相關工作4 方法論4.1 構建一個over-parameterized網絡3.2 二值化的path3.3 基於硬件的latency3.4 基於強化學習

tiaozhanzhe1900

2020-06-29 02:29:42

文獻閱讀（69）

文章目錄1 縮寫 & 引用2 abstract & introduction3 提出的方法3.1 稀疏度的定義3.2 layer-wise polishment(LWP)3.3 梯度優化4 實驗結果4.1 layer-wise

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（57）

文章目錄1 縮寫 & 引用2 abstract & introduction3 細粒度混合精度4 稀疏深度學習計算單元5 跳零MAC運算6 輸入負載平衡題目：An Energy-Efficient Sparse Deep-Ne

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（76）

文章目錄1 abstract & introduction2 網絡設計2.1 ShuffleNetV22.2 網絡主要的改進2.3 網絡量化3 accelerator結構3.1 軟件接口題目：Synetgy: Algorith

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（60）

文章目錄1 縮寫&引用2 abstract & introduction3 background & related work4 addnet可配置乘法器4.1 可配置乘法器4.2 FPGA乘法器映射4.3 架構5 addnet訓

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（63）

文章目錄1 縮寫 & 引用2 abstract & introduction3 零權重skip3.1 權重lookahead3.2 權重lookaside3.3 硬件連接和軟件影響題目：Bit-Tactical: A Soft

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（61）

文章目錄1 縮寫 & 引用2 abstract & introduction3 方法論3.1 通用的基於LUT的有常數乘法4 run-time可配置的CNN卷積核架構4.1 通用架構4.2 faithfully rounded S

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（74）

文章目錄1 縮寫 & 引用2 abstract & introduction3 背景3.1 餘數系統3.2 壓縮算法3.3 相關工作4 提出的架構題目：Res-DNN: A Residue Number System-Base

tiaozhanzhe1900

2020-06-29 02:29:41

文獻閱讀（37）

文章目錄1 縮寫 & 引用2 abstract & introduction3 前端設計方法3.1 背景3.2 OOHLS overview3.3 latency insensitive(LI) channels3.4 Match

tiaozhanzhe1900

2020-06-29 02:29:41

24小時熱門文章

最新文章

最新評論文章