【算力理解】MIPS/DMIPS/MFLOPS 理解

前言

現在隨着計算機使用了多級流水線結構,取指、譯碼、執行等並行方式,單純使用頻率確定性能不太合理,所以採用計算性能來測定cpu性能比較合理,主要有MIPS,DMIPS和FLOPS三個主要概念。

MIPS(Million Instructions Per Second)

MIPS(Million Instructions Per Second):字面理解爲百萬條指令/秒,即每秒執行百萬級指令數。這是衡量CPU速度的一個指標。像是一個Intel 80386 電腦可以每秒處理3百萬到5百萬機器語言指令,既我們可以說80386是3到5MIPS的CPU。MIPS只是衡量CPU性能的指標。

DMIPS(Dhrystone Million Instructions executed Per Second)

Dhrystone是測量處理器運算能力的最常見基準程序之一,常用於處理器的整型運算性能的測量。Dhrystone是一種整數運算測試程序。

FLOPS:Floating-point Operations Per Second

表示CPU的每秒執行的浮點運算次數,主要用於衡量計算機的浮點運算能力。

  • 1 MFLOPS = 10^6 FLOPS
  • 1 GFLOPS = 10^9 FLOPS
  • 1 TFLOPS = 10^12 FLOPS
  • 1 PFLOPS = 10^15 FLOPS

TOPS: Tera Operations Per Second

處理器每秒鐘可進行10^12操作,包括整數的運算和浮點數運算,和FLOPS有一定差別。

NVIDIA T4顯卡性能

NVIDIA T4顯卡性能 :https://www.nvidia.com/en-us/data-center/tesla-t4/
說明了FP32的浮點運算爲 8.1TFLOPS,但是用INT4的整數運算時,可達到 260 TOPS

參數 數值
TURING TENSOR CORES 320
NVIDIA CUDA® CORES 2,560
SINGLE PRECISION PERFORMANCE 8.1 FP32 TFLOPS
MIXED PRECISION (FP16/FP32) 65 FP16 TFLOPS
INT8 PRECISION 130 INT8 TOPS
INT4 PRECISION 260 INT4 TOPS

其他顯卡性能

產品 性能
谷歌 Cloud TPU v3 420 TFLOPS
華爲昇騰910 256 TFLOPS
Groq TSP 250 TFLOPS
NVIDIA Tesla V100 GPU 125 TFLOPS
Intel Movidius 100 GFLOPS
Intel 10代酷睿 1.12 (FP32)TFLOPS 2.25(FP16)TFLOPS
地平線 Sunrise 4 TOPS
高通驍龍865 15 TOPS
高通驍龍855 7 TOPS

ARM處理器比較 Cortex-A 系列

Core Architecture bits I-Cache D-Cache DMIPS/MHz
ARM11 v7-A 32 4-64K 4-64K 1.25
Cortex-A5 ARMv7-A 32 4-64K 4-64K 1.57
Cortex-A7 ARMv7-A 32 8-64K 8-64K 1.9
Cortex-A8 ARMv7-A 32 16-32K 16-32K 2.0
Cortex-A9 ARMv7-A 32 16-64K 16-64K 2.5
Cortex-A12 ARMv7-A 32 - - 3.5
Cortex-A15 ARMv7-A 32 32K 32K 3.4
Cortex-A17 ARMv7-A 32 32-64K 32K 3.2
Cortex-A32 ARMv8-A 32 8-64K 8-64K 2.3
Cortex-A35 ARMv8-A 32/64 8-64K 8-64K 2.5
Cortex-A53 ARMv8-A 32/64 8-64K 8-64K 2.3
Cortex-A55 ARMv8.2-A 32/64 64K 64K 2.7
Cortex-A57 ARMv8-A 32/64 48K 32K 4.1
Cortex-A72 ARMv8-A 32/64 48K 32K 4.7
Cortex-A73 ARMv8-A 32/64 64K 32-64k 4.8
Cortex-A75 ARMv8.2-A 32/64 64K 64k 5.2
Cortex-A76 ARMv8.2-A 32/64 64K 64k -

ARM處理器比較 Cortex-M 系列

Core Architecture bits DMIPS/MHz DSP
Cortex-M0 ARMv6M 32 0.9~0.99
Cortex-M3 ARMv6M 32 1.25~1.5
Cortex-M4 ARMv6M 32 1.25~1.52
Cortex-M7 ARMv7-M 32 2.14/2.55/3.23
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章