飛騰與鯤鵬性能差異的一些思考

飛騰與鯤鵬性能差異的一些思考


背景

自己在進行stress-ng以及sysbench的測試驗證時發現:
飛騰的性能要比鯤鵬的性能有非常大的差距.
最近同事在現場也進行了壓測, 也發現飛騰的性能不是特別好.
這裏想簡單總結一下自己學習過的資料,嘗試分析一下爲何差異這麼大. 

製程

注意 製程採用臺積電發佈的時間進行對比.主要是對比代數和年代差異
飛騰使用的應該是 16nm製程工藝. 
該工藝的大量上市的時間應該是2015年. 
鯤鵬使用的應該是 7nm的職稱工藝
該工藝的大量上市的時間應該是2018年.
中間至少有一代10nm以及一些改良製程. 
換句話說, 鯤鵬的製造工藝至少比飛騰要領先三年. 

但是需要說明一點的是 阿里的倚天710 使用的是 5nm的工藝. 
5nm工藝大概是2021年左右大量上市. 所以 倚天的製造工藝應該國產CPU裏面最先進的
也是核心數最多的, 單芯片封裝 128個 Core
飛騰和鯤鵬都是封裝了 64個核心. 

通過製程上面的對比會發現 鯤鵬領先與飛騰,並且按照沒代能夠提升15%左右的性能的話, 其實是很可觀的
也是因爲製程升級不夠快,才導致intel的CPU性能被AMD趕超

主頻

鯤鵬的CPU主頻一般是 2.6Ghz
飛騰的CPU的主頻一般是 2.1Ghz
這一塊差異高達 20%+ 直接導致性能差異會很大
單核能力的RT以及TPS都會有至少20%甚至更高的差異. 
基本相同的架構上面比拼的其實更多的都是頻率的能力. 

架構

說明一下同頻性能一般考慮的是相同架構的服務器.
如果不同架構的服務器是無法比較同頻性能的. 

雖然鯤鵬和飛騰都是ARM架構的CPU
但是通過一些簡單的查看會發現.
飛騰的CPU的指令集如下:
fp asimd evtstrm aes pmull sha1 sha2 crc32 cpuid
但是鯤鵬的指令集就會多一些:
fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop asimddp asimdfhm

簡單查詢就會發現
飛騰應該是使用的ARMv8.0的架構,也就是第一代64位的ARMv8架構
但是對應的鯤鵬的卻至少是 ARMv8.2的架構
換句話說說, 鯤鵬的架構至少比飛騰先進兩小代, 這個性能差異也是很大的. 
更新的指令集通過硬件實現指令, 在特殊場景下能夠極大的提高性能.
但是這種新指令集一般對SPEC2006/2017的測試結果影響很小. 
所以可以看出來飛騰的跑分可能不比鯤鵬低多少,但是很多高級應用可能就會比鯤鵬差的比較多

架構-2

兩路的S2500可以看到有
16個numa節點
兩路的鯤鵬920只有
4個numa節點
越少的numa節點說明訪存一致性越好

另外發現鯤鵬的緩存比飛騰的少.
雖然一般緩存越多性能越好, 但是懷疑是飛騰的多核之間的通信做的不夠好
所以都是獨立的一二級緩存, 導致緩存總數多. 但是實際性能不如鯤鵬. 

對應numa節點太多.緩存需要進行MESI算法就會增多,會極大的降低吞吐量.
架構設計上的不完備, 會導致飛騰的性能比不上鯤鵬. 

其他硬件兼容

1. 內存
發現我這邊的飛騰的內存是等效 3200MT/S
鯤鵬的是 2933MT/S
理論上飛騰的訪存性能應該要比鯤鵬的帶寬要搭的
但是懷疑因爲上面說的numa節點劃分的問題.導致飛騰的訪存比較拉胯
2. 硬盤
感覺鯤鵬的RAID卡是國際大廠的. 但是飛騰的我不太認識. 這一塊可能跟主機廠商關係更大
但是感覺鯤鵬畢竟有之前超聚變投入的研發, 應該不比飛騰要差, 合作關係上要比飛騰要好.
3. 網絡
網絡棧上面不需要比較, 這是華爲看家本領, 比飛騰強..
4. 操作系統
華爲有OpenEuler, 中國電子旗下的銀河麒麟也基於OpenEuler. 也比飛騰強.
5. 應用層
華爲有畢昇JDK.. 這個也是碾壓的存在..

彙總

雖然華爲已經三年不允許找臺積電代工
但是三年前流傳下來的祖傳CPU已經比飛騰能打. 
感覺除了倚天710, 鯤鵬在國產CPU還是第一檔的存在. 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章