AI芯片:華爲昇騰(ASCEND)310結構分析

華爲的麒麟SOC中使用的是寒武紀的AI芯片模塊。
但是,華爲自己也推出了自有的AI芯片架構。
本文根據華爲公佈的信息,簡單分析下其結構。

所有信息都來自互聯網,來自華爲的官方信息。
感謝華爲的分享!!

首先看看,華爲發佈的一張海報,如下圖所示。
在這裏插入圖片描述
整體採用華爲自研的達芬奇架構,採用高性能的3D Cube計算引擎。

因爲興趣及工作領域的因素,我更關注其芯片內部的AI 卷積核的設計。

從海報中能夠看出,AI core 採用的是二維平面陣列結構,應該是類似谷歌TPU的脈動陣列結構。
從海報中可知,單個AI Core每週期可完成4096次MAC運算,那麼4096=64X64,所以猜測MAC陣列的尺寸是64X64的。
支持8T半精度浮點計算和16T整型int8計算。
從公佈的算力來看:
8T= 4K(4096 MAC) X 2(雙核) X 1G(頻率1GHz)

整體架構類似谷歌的TPU2,都是雙核的。

還支持多核堆疊。這個容易。因爲AI計算屬於計算密集型,與CPU相比,對控制的要求不高,控制簡單。所以,可以多搞幾個核,同時利用相同的輸入數據進行計算,線性提升計算速度。

目前能知道的也就這麼多了。
很好奇提到的3D Cube計算引擎到底指的什麼?
是說的軟件算法的計算引擎,還是指的硬件邏輯的計算架構?

另外:
昨天,美國宣佈要對華爲實行實體清單,斷供來自美國芯片,大華爲面臨巨大考驗,希望能夠挺住!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章