ARM 處理器 MIPS/DMIPS/MFLOPS 理解
前言
現在隨着計算機使用了多級流水線結構,取指、譯碼、執行等並行方式,單純使用頻率確定性能不太合理,所以採用計算性能來測定cpu性能比較合理,主要有MIPS,DMIPS和FLOPS三個主要概念。
MIPS(Million Instructions Per Second)
MIPS(Million Instructions Per Second):字面理解爲百萬條指令/秒,即每秒執行百萬級指令數。這是衡量CPU速度的一個指標。像是一個Intel 80386 電腦可以每秒處理3百萬到5百萬機器語言指令,既我們可以說80386是3到5MIPS的CPU。MIPS只是衡量CPU性能的指標。
DMIPS(Dhrystone Million Instructions executed Per Second)
Dhrystone是測量處理器運算能力的最常見基準程序之一,常用於處理器的整型運算性能的測量。Dhrystone是一種整數運算測試程序。
FLOPS:Floating-point Operations Per Second
表示CPU的每秒執行的浮點運算次數,主要用於衡量計算機的浮點運算能力。
- 1 MFLOPS = 10^6 FLOPS
- 1 GFLOPS = 10^9 FLOPS
- 1 TFLOPS = 10^12 FLOPS
- 1 PFLOPS = 10^15 FLOPS
TOPS: Tera Operations Per Second
處理器每秒鐘可進行10^12操作,包括整數的運算和浮點數運算,和FLOPS有一定差別。
NVIDIA T4顯卡性能
NVIDIA T4顯卡性能 :https://www.nvidia.com/en-us/data-center/tesla-t4/
說明了FP32的浮點運算爲 8.1TFLOPS,但是用INT4的整數運算時,可達到 260 TOPS
參數 | 數值 |
---|---|
TURING TENSOR CORES | 320 |
NVIDIA CUDA® CORES | 2,560 |
SINGLE PRECISION PERFORMANCE | 8.1 FP32 TFLOPS |
MIXED PRECISION (FP16/FP32) | 65 FP16 TFLOPS |
INT8 PRECISION | 130 INT8 TOPS |
INT4 PRECISION | 260 INT4 TOPS |
其他顯卡性能
產品 | 性能 |
---|---|
谷歌 Cloud TPU v3 | 420 TFLOPS |
華爲昇騰910 | 256 TFLOPS |
Groq TSP | 250 TFLOPS |
NVIDIA Tesla V100 GPU | 125 TFLOPS |
Intel Movidius | 100 GFLOPS |
Intel 10代酷睿 | 1.12 (FP32)TFLOPS 2.25(FP16)TFLOPS |
地平線 Sunrise | 4 TOPS |
高通驍龍865 | 15 TOPS |
高通驍龍855 | 7 TOPS |
ARM處理器比較 Cortex-A 系列
Core | Architecture | bits | I-Cache | D-Cache | DMIPS/MHz |
---|---|---|---|---|---|
ARM11 | v7-A | 32 | 4-64K | 4-64K | 1.25 |
Cortex-A5 | ARMv7-A | 32 | 4-64K | 4-64K | 1.57 |
Cortex-A7 | ARMv7-A | 32 | 8-64K | 8-64K | 1.9 |
Cortex-A8 | ARMv7-A | 32 | 16-32K | 16-32K | 2.0 |
Cortex-A9 | ARMv7-A | 32 | 16-64K | 16-64K | 2.5 |
Cortex-A12 | ARMv7-A | 32 | - | - | 3.5 |
Cortex-A15 | ARMv7-A | 32 | 32K | 32K | 3.4 |
Cortex-A17 | ARMv7-A | 32 | 32-64K | 32K | 3.2 |
Cortex-A32 | ARMv8-A | 32 | 8-64K | 8-64K | 2.3 |
Cortex-A35 | ARMv8-A | 32/64 | 8-64K | 8-64K | 2.5 |
Cortex-A53 | ARMv8-A | 32/64 | 8-64K | 8-64K | 2.3 |
Cortex-A55 | ARMv8.2-A | 32/64 | 64K | 64K | 2.7 |
Cortex-A57 | ARMv8-A | 32/64 | 48K | 32K | 4.1 |
Cortex-A72 | ARMv8-A | 32/64 | 48K | 32K | 4.7 |
Cortex-A73 | ARMv8-A | 32/64 | 64K | 32-64k | 4.8 |
Cortex-A75 | ARMv8.2-A | 32/64 | 64K | 64k | 5.2 |
Cortex-A76 | ARMv8.2-A | 32/64 | 64K | 64k | - |
ARM處理器比較 Cortex-M 系列
Core | Architecture bits | DMIPS/MHz | DSP |
---|---|---|---|
Cortex-M0 | ARMv6M | 32 | 0.9~0.99 |
Cortex-M3 | ARMv6M | 32 | 1.25~1.5 |
Cortex-M4 | ARMv6M | 32 | 1.25~1.52 |
Cortex-M7 | ARMv7-M | 32 | 2.14/2.55/3.23 |