神經網絡映射的論文閱讀

脈衝神經網絡硬件系統的路由仲裁策略及映射算法研究

——————————————————————————————————————————————————————————————————


——————————————————————————————————————————————————————————————————

1. 背景介紹

  • 脈衝神經網絡映射:將脈衝神經網絡的脈衝神經元節點分配給硬件平臺的計算單元上的過程。脈衝神經元與計算單元之間是一一對應的,因此脈衝神經網絡的映射問題屬於二次分配問題,可利用智能優化算法解決。
  • 片上網絡:分爲計算子系統和通信子系統,計算子系統由計算單元組成,通信子系統由路由器及其連接的通信鏈路組成。
    計算單元和路由器的互連結構即拓撲結構。
  • 片上網絡技術已被應用於脈衝神經網絡:(1)神經元和突觸映射到片上網絡的計算單元模塊(2)神經元軸突由片上網絡的路徑構成(3)神經元之間的連接結構由片上網絡的拓撲結構模擬。

本文的核心內容:利用智能優化算法解決脈衝神經網絡映射問題,尋找最佳映射方案。

2. 思路

  • 片上網絡的設計:(1)路由算法(XY)(2)仲裁策略(基於脈衝發送頻率的動態優先級仲裁策略)。
  • 智能優化算法:結合粒子羣算法、遺傳算法、免疫算法

2.1 片上網絡的設計

  • 基於EMBRACE架構,提出的脈衝神經網絡動態優先級仲裁策略:

圖1 動態優先級路由器基本結構
在這裏插入圖片描述

RD:路由計算模塊(Routing Decision),用於實現路由算法,採用了XY路由算法;
FIFO:用於緩存來自該方向的數據包,爲動態優先級仲裁模塊提供交通狀態輔助信息;
DR:方向寄存器模塊(Direction Register),用於緩存發送給各個方向的數據包,爲動態優先級仲裁模塊提供狀態信息;
DWG:方向權值模塊(Direction Weight Generator),用於計算其對應的方向權值,並將計算結果送入仲裁器模塊以完成路由仲裁過程;
PA:動態優先級仲裁器模塊(Priority Arbiter),用於實現脈衝神經網絡路由節點的優先級仲裁算法。

  • 動態優先級仲裁模塊

圖2 動態優先級仲裁基本流程
在這裏插入圖片描述

在路由器工作過程中,方向寄存器模塊與 FIFO 內的數據不斷地發送與存儲,對於高頻路徑,其所得到的優先級較高,所以高頻路徑的數據將優先得到發送,其數據平均延遲較低;而在一定時間內低頻路徑所得到的優先級較低,其數據平均延遲則較高。
但是,高優先級的數據包得到發送後,會降低對應方向寄存器模塊的數據優先級;而低優先級數據包對應的方向寄存器模塊內的數據因爲初始階段數據發送緩慢,經過一定時間的數據存儲後,優先級會升高,從而使數據得到傳送。

這一動態優先級調整過程,能夠使得方向寄存器模塊內數據包優先級不斷變化,避免低頻交通路徑及整個系統因動態優先級仲裁策略造成數據“飢餓”、丟包的情況發生。

  • 實驗:本節針對輪詢仲裁方案、固定優先級仲裁策略及動態優先級仲裁策略三種不同的仲裁方案進行仿真分析,實驗基於 Izhikevich 脈衝神經元模型,使用基於 System C 的時鐘級片上網絡仿真器 Noxim 搭建仿真實驗平臺,比較了三種不同仲裁方案在面對複雜網絡交通模式下的 網絡平均包延遲、吞吐率、網絡平均包延遲等性能指標,以此對比分析本文所提出的面向高頻數據請求的動態優先級仲裁策略性能。
    同時,本實驗採用 VHDL 語言對路由器各個模塊進行仿真實現,使用 Synopsis Design Compiler 在 90nm CMOS 工藝下,基於100MHz 的路由器工作頻率,對本文所提出的動態優先級路由器進行功耗和硬件面積分析,從而對硬件性能進行評測。

  • 實驗結果分析:本文設計的動態優先級仲裁器較另外兩種仲裁策略而言,在降低高頻路徑延遲上有很好的效果,在低頻路徑的延遲上有所增加,但並未影響其數據包的正常收發,脈衝數據包能夠在脈衝時序允許範圍內及時到達目的結點,不會對脈衝神經網絡性能產生影響。
    除此之外,三種仲裁策略在系統吞吐率、網絡平均包延遲方面性能相似,沒有太大差異。

2.2 智能映射算法設計

  • 本文介紹了一種面向功耗的脈衝神經網絡混合粒子羣映射算法,結合了粒子羣算法和遺傳算法。

圖3 混合粒子羣算法
在這裏插入圖片描述

  • 本文還介紹了一種多目標脈衝神經網絡映射算法。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章