概念
PE,邏輯核心(logic core),一個邏輯核心上可以跑一個線程
常用PE(process element)表示一個計算單元,具體功能不盡相同
PE的實現可以是 cpu gpu dsp fpga asic , npu apu ...
MPcores芯片分類
CPU、DSP、 AI加速器(NPU) GPU、ASIC、FPGA 的 混合 組合.
CPU適合邏輯控制、串行運算與通用類型數據運算,
GPU擁有大規模並行計算架構,擅長處理諸如圖形計算等多重任務。由於深度學習通常需要大量的但並不複雜的訓練算法,因此相比CPU而言,GPU更適合深度學習運算。
FPGA(現場可編程門陣列)是一直可編程的半定製芯片,具有並行處理優勢,並且也可以設計成具有多內核的形態。FPGA最大的優勢在於其可編程的特性,用戶可以根據需要的邏輯功能對電路進行快速燒錄來實現自定義硬件功能。
ASIC芯片(相較於CPU、GPU等通用型芯片以及半定製的FPGA來說)的計算能力和計算效率都直接根據特定的算法的需要進行定製的,因此ASIC芯片具有體積小、功耗低、可靠性高、計算性能高、計算效率高等優勢。所以在其所針對的特定的應用領域,ASIC芯片的能效表現要遠超CPU、GPU等通用型芯片以及半定製的FPGA。
芯片廠商
intel amd arm
intel amd
st nxp bcom
st |
nxp |
nxp |
|
同構 |
異構 |
同構 |
異構 |
|
STM32WB(CM0+CM4) |
i.MX 6DualLite (2 x A9) |
K32 L3(CM4+CM0+) |
|
STM32H7(M4+M7) |
i.MX 6DualPlus (2 x A9) |
i.MX RT1170(M4+M7) |
|
stm32MP1(M4+A7) |
i.MX 6Quad (4 x A9) |
i.MX RT600(M33+DSP Tensilica HIFI4) |
|
|
i.MX 6QuadPlus (4 x A9) |
i.MX 6SoloX(A9+M4) |
|
|
|
i.MX 7ULP (A7+M4) |
|
|
|
i.MX 7Dual( 2 x A7 + M4) |
|
|
|
i.MX 8 (2A72+4A53+2M4F+DSP+2GPU) |
蘋果 高通 華爲 三星 MTK 展訊
蘋果 華爲 三星 小米 vivo
第一代AI芯片驍龍820上的Zeroth神經元處理器、
第二代AI芯片驍龍835集成了驍龍神經處理引擎SDK,能夠利用芯片的異構計算能力來加強機器學習。
第三代AI芯片驍龍845集成高通最新推出的人工智能引擎AI Engine,能夠實現最頂尖的終端AI處理。
目前,驍龍835、驍龍710、驍龍660等AI芯片都支持了該人工智能引擎AI Engine