飛騰與鯤鵬性能差異的一些思考
背景
自己在進行stress-ng以及sysbench的測試驗證時發現:
飛騰的性能要比鯤鵬的性能有非常大的差距.
最近同事在現場也進行了壓測, 也發現飛騰的性能不是特別好.
這裏想簡單總結一下自己學習過的資料,嘗試分析一下爲何差異這麼大.
製程
注意 製程採用臺積電發佈的時間進行對比.主要是對比代數和年代差異
飛騰使用的應該是 16nm製程工藝.
該工藝的大量上市的時間應該是2015年.
鯤鵬使用的應該是 7nm的職稱工藝
該工藝的大量上市的時間應該是2018年.
中間至少有一代10nm以及一些改良製程.
換句話說, 鯤鵬的製造工藝至少比飛騰要領先三年.
但是需要說明一點的是 阿里的倚天710 使用的是 5nm的工藝.
5nm工藝大概是2021年左右大量上市. 所以 倚天的製造工藝應該國產CPU裏面最先進的
也是核心數最多的, 單芯片封裝 128個 Core
飛騰和鯤鵬都是封裝了 64個核心.
通過製程上面的對比會發現 鯤鵬領先與飛騰,並且按照沒代能夠提升15%左右的性能的話, 其實是很可觀的
也是因爲製程升級不夠快,才導致intel的CPU性能被AMD趕超
主頻
鯤鵬的CPU主頻一般是 2.6Ghz
飛騰的CPU的主頻一般是 2.1Ghz
這一塊差異高達 20%+ 直接導致性能差異會很大
單核能力的RT以及TPS都會有至少20%甚至更高的差異.
基本相同的架構上面比拼的其實更多的都是頻率的能力.
架構
說明一下同頻性能一般考慮的是相同架構的服務器.
如果不同架構的服務器是無法比較同頻性能的.
雖然鯤鵬和飛騰都是ARM架構的CPU
但是通過一些簡單的查看會發現.
飛騰的CPU的指令集如下:
fp asimd evtstrm aes pmull sha1 sha2 crc32 cpuid
但是鯤鵬的指令集就會多一些:
fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop asimddp asimdfhm
簡單查詢就會發現
飛騰應該是使用的ARMv8.0的架構,也就是第一代64位的ARMv8架構
但是對應的鯤鵬的卻至少是 ARMv8.2的架構
換句話說說, 鯤鵬的架構至少比飛騰先進兩小代, 這個性能差異也是很大的.
更新的指令集通過硬件實現指令, 在特殊場景下能夠極大的提高性能.
但是這種新指令集一般對SPEC2006/2017的測試結果影響很小.
所以可以看出來飛騰的跑分可能不比鯤鵬低多少,但是很多高級應用可能就會比鯤鵬差的比較多
架構-2
兩路的S2500可以看到有
16個numa節點
兩路的鯤鵬920只有
4個numa節點
越少的numa節點說明訪存一致性越好
另外發現鯤鵬的緩存比飛騰的少.
雖然一般緩存越多性能越好, 但是懷疑是飛騰的多核之間的通信做的不夠好
所以都是獨立的一二級緩存, 導致緩存總數多. 但是實際性能不如鯤鵬.
對應numa節點太多.緩存需要進行MESI算法就會增多,會極大的降低吞吐量.
架構設計上的不完備, 會導致飛騰的性能比不上鯤鵬.
其他硬件兼容
1. 內存
發現我這邊的飛騰的內存是等效 3200MT/S
鯤鵬的是 2933MT/S
理論上飛騰的訪存性能應該要比鯤鵬的帶寬要搭的
但是懷疑因爲上面說的numa節點劃分的問題.導致飛騰的訪存比較拉胯
2. 硬盤
感覺鯤鵬的RAID卡是國際大廠的. 但是飛騰的我不太認識. 這一塊可能跟主機廠商關係更大
但是感覺鯤鵬畢竟有之前超聚變投入的研發, 應該不比飛騰要差, 合作關係上要比飛騰要好.
3. 網絡
網絡棧上面不需要比較, 這是華爲看家本領, 比飛騰強..
4. 操作系統
華爲有OpenEuler, 中國電子旗下的銀河麒麟也基於OpenEuler. 也比飛騰強.
5. 應用層
華爲有畢昇JDK.. 這個也是碾壓的存在..
彙總
雖然華爲已經三年不允許找臺積電代工
但是三年前流傳下來的祖傳CPU已經比飛騰能打.
感覺除了倚天710, 鯤鵬在國產CPU還是第一檔的存在.