MIC編程(3)——MIC峯值性能計算方法

SE10P:

1. 單精度峯值性能:  32 SP FLOPs/clock/core * 61 cores * 1.1GHz =2147.2 GFLOP/s

2. 雙精度峯值性能:  16 DPFLOPs/clock/core * 61 cores * 1.1GHz = 1073.6 GFLOP/s

3. 內存帶寬:  4 Bytes/channel * 16 mem. channels * 5.5GT/s= 352GB/s


5110P:

1. 單精度峯值性能:  32 SP FLOPs/clock/core * 60 cores * 1.053GHz =2021.76 GFLOP/s

2. 雙精度峯值性能:  16 DPFLOPs/clock/core * 60 cores * 1.053GHz = 1010.88 GFLOP/s

3. 內存帶寬:  4 Bytes/channel * 16 mem. channels * 5.0GT/s= 352GB/s


注:32SP FLOPs/clock/core =512/32*2,是指512bits向量化和FMA指令,雙精度類似。

發佈了32 篇原創文章 · 獲贊 31 · 訪問量 17萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章