文獻閱讀(73)

  • 題目:Convolutional Neural Network Accelerator with Vector Quantization
  • 時間:2019
  • 會議:ISCAS
  • 研究機構:國立臺灣大學
  • 參考鏈接:https://blog.csdn.net/lishuiwang/article/details/78483547

1 縮寫 & 引用

Quantized cnn: a unified approach to accelerate and compress convolutional networks 2017 IEEE Transactions on Neural Networks and Learning Systems

2 abstract & introduction

本篇論文的主要貢獻:

  1. 提出了DNN壓縮方法:向量量化vector quantizaion
  2. 提出了accelerator,可以支持不同的codebook和kernel尺寸
  3. cycle-accurate python model來估計模擬這種dataflow,估計所需的cycle數

3 提出的架構

首先矢量量化vector quantization需要將數據分成好幾個子空間,分割方法是每CsC_s'個input channel分成一個子空間,比如下圖是按照Cs=4C_s'=4分割的
在這裏插入圖片描述
分割完子空間,每個子空間有一個codebook,有K個可能的權重矢量

在這裏插入圖片描述

3.1 PE架構

因爲有codebook,計算也可以通過查找表進行,所以PE計算流程分成預計算、dispatch、累加三步,預計算就是提前計算好查找表
在這裏插入圖片描述

4 數據流

數據流包括weight stationary、row stationary-like

5 實現結果

  • caffenet:Cs=4C_s'=4K=128K=128
  • VGG-16:Cs=8C_s'=8K=128K=128
    只是綜合了,沒有流片,還通過一個週期準確的python模型來仿真週期數
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章