- 題目:Convolutional Neural Network Accelerator with Vector Quantization
- 時間:2019
- 會議:ISCAS
- 研究機構:國立臺灣大學
- 參考鏈接:https://blog.csdn.net/lishuiwang/article/details/78483547
1 縮寫 & 引用
Quantized cnn: a unified approach to accelerate and compress convolutional networks 2017 IEEE Transactions on Neural Networks and Learning Systems
2 abstract & introduction
本篇論文的主要貢獻:
- 提出了DNN壓縮方法:向量量化vector quantizaion
- 提出了accelerator,可以支持不同的codebook和kernel尺寸
- cycle-accurate python model來估計模擬這種dataflow,估計所需的cycle數
3 提出的架構
首先矢量量化vector quantization需要將數據分成好幾個子空間,分割方法是每個input channel分成一個子空間,比如下圖是按照分割的
分割完子空間,每個子空間有一個codebook,有K個可能的權重矢量
3.1 PE架構
因爲有codebook,計算也可以通過查找表進行,所以PE計算流程分成預計算、dispatch、累加三步,預計算就是提前計算好查找表
4 數據流
數據流包括weight stationary、row stationary-like
5 實現結果
- caffenet:,
- VGG-16:,
只是綜合了,沒有流片,還通過一個週期準確的python模型來仿真週期數