概念
PE,逻辑核心(logic core),一个逻辑核心上可以跑一个线程
常用PE(process element)表示一个计算单元,具体功能不尽相同
PE的实现可以是 cpu gpu dsp fpga asic , npu apu ...
MPcores芯片分类
CPU、DSP、 AI加速器(NPU) GPU、ASIC、FPGA 的 混合 组合.
CPU适合逻辑控制、串行运算与通用类型数据运算,
GPU拥有大规模并行计算架构,擅长处理诸如图形计算等多重任务。由于深度学习通常需要大量的但并不复杂的训练算法,因此相比CPU而言,GPU更适合深度学习运算。
FPGA(现场可编程门阵列)是一直可编程的半定制芯片,具有并行处理优势,并且也可以设计成具有多内核的形态。FPGA最大的优势在于其可编程的特性,用户可以根据需要的逻辑功能对电路进行快速烧录来实现自定义硬件功能。
ASIC芯片(相较于CPU、GPU等通用型芯片以及半定制的FPGA来说)的计算能力和计算效率都直接根据特定的算法的需要进行定制的,因此ASIC芯片具有体积小、功耗低、可靠性高、计算性能高、计算效率高等优势。所以在其所针对的特定的应用领域,ASIC芯片的能效表现要远超CPU、GPU等通用型芯片以及半定制的FPGA。
芯片厂商
intel amd arm
intel amd
st nxp bcom
st |
nxp |
nxp |
|
同构 |
异构 |
同构 |
异构 |
|
STM32WB(CM0+CM4) |
i.MX 6DualLite (2 x A9) |
K32 L3(CM4+CM0+) |
|
STM32H7(M4+M7) |
i.MX 6DualPlus (2 x A9) |
i.MX RT1170(M4+M7) |
|
stm32MP1(M4+A7) |
i.MX 6Quad (4 x A9) |
i.MX RT600(M33+DSP Tensilica HIFI4) |
|
|
i.MX 6QuadPlus (4 x A9) |
i.MX 6SoloX(A9+M4) |
|
|
|
i.MX 7ULP (A7+M4) |
|
|
|
i.MX 7Dual( 2 x A7 + M4) |
|
|
|
i.MX 8 (2A72+4A53+2M4F+DSP+2GPU) |
苹果 高通 华为 三星 MTK 展讯
苹果 华为 三星 小米 vivo
第一代AI芯片骁龙820上的Zeroth神经元处理器、
第二代AI芯片骁龙835集成了骁龙神经处理引擎SDK,能够利用芯片的异构计算能力来加强机器学习。
第三代AI芯片骁龙845集成高通最新推出的人工智能引擎AI Engine,能够实现最顶尖的终端AI处理。
目前,骁龙835、骁龙710、骁龙660等AI芯片都支持了该人工智能引擎AI Engine