AI芯片體系結構目標圖形處理

AI芯片體系結構目標圖形處理

AI chip architecture targets graph processing

可編程圖形流處理器(GSP)能夠執行“直接圖形處理、片上任務圖管理和執行以及任務並行性”。設計GSP是爲了滿足人工智能處理的需求,而這些需求以前是GPU、CPU或DSP無法滿足的。
在這裏插入圖片描述
GSP體系結構由一系列圖形流處理器、專用數學處理器、硬件控制和各種類型的數據緩存組成。GSP可以提供:“真正的任務級並行,最小限度地使用片外存儲器,深度優先的硬件圖形調度,完全可編程的體系結構。”

圖形計算

雖然人工智能有許多不同類型的神經網絡,所有的神經網絡都是基於圖形的,這允許開發人員利用圖形原生結構在單個架構上構建多個神經網絡和整個工作流。

然而,在圖形計算領域,人工智能處理中需要“數據流圖的優化和編譯”。

GSP聲稱在三個方面與其他基於圖形的數據流處理器有所不同。

首先,“完全可編程的”,能夠執行“廣泛的任務”。

其次,它是“動態可編程的……在一個時鐘週期內”

第三,“提供流媒體的集成”,這使得最小化延遲成爲可能。這種巨大的效率倍增器是通過“數據流機制”實現的,在這種機制中,非計算性數據移動被最小化或消除。
在這裏插入圖片描述
GSP體系結構的圖形本機特性可以最小化數據在外部DRAM之間的來回移動。外部只需要第一個輸入和最終輸出,而中間的其他數據只是臨時的中間數據。這將大大減少內存帶寬和功耗。
在這裏插入圖片描述
在芯片、板和系統級別上儘可能降低延遲、減少內存需求和能源需求。

試點項目的經驗教訓

通過儘早推出GSP嵌入式桌面設備,“我們獲得了進入真正客戶及其工作負載需求的入場券。”
通過這些試點,基於GSP的平臺有更多的應用程序和細分市場。其普惠制解決的市場範圍從汽車和智能視覺(監視)到企業計算。

GSP可以滿足從雲中的數據中心到收集數據的邊緣的所有地方施加的較低的能量限制。
GSP的驅動力正在迅速改變深度學習技術,包括新的拓撲、神經網絡和算法。如此快節奏的技術進步常常促使客戶希望芯片能做XYZ。這就是完全可編程的GSP架構發揮作用的地方。
例如,在汽車領域,GSP將應用於智能遠程信息處理、ADAS、駕駛員監控和乘客評估。關鍵是許多汽車應用的單一GSP體系結構。

例如,單芯片可以結合激光雷達傳感器輸入和點雲進行ISP處理、語義分割和傳感器融合。這是通過視頻目標檢測和激光測距兩個並行執行的數據流圖來實現的。

由於GSP的主要市場是汽車(汽車客戶總是要求確定性),GSP架構是“確定性的”。
最終開發了一個名爲“Blaize NetDeploy”的工具。許多客戶已經花了數週時間在優化GPU上經過訓練的人工智能模型,並將其轉換爲在推理機上部署。一個軟件工具,可以加速量化、修剪和壓縮神經網絡的過程。
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章