科技雲報道:ARM十年磨一劍,v9新架構會重構CPU市場嗎?

科技雲報道原創。

近日,ARM正式宣佈推出ARMv9架構。據ARM官方稱,這是10年來最重要的創新,是未來3000億ARM芯片的基礎。

與上一代的ARMv8相比,ARMv9處理器將不再侷限於移動/嵌入式市場,而是擴展到PC、HPC高性能計算、深度學習等新市場,以滿足全球對功能日益強大的安全、人工智能和專用處理的需求。

ARMv9架構的發佈,會對CPU市場帶來什麼樣的影響?對於中國而言,是否能夠解“缺芯”之急呢?

 

ARMv9的三大亮點

2011年10月,ARM首次發佈ARMv8架構,十年後的今天,ARMv9立足於ARMv8的成功基礎,將成爲擔綱未來十年的主流計算架構。那麼,它和ARMv8架構相比有哪些不同呢?

據ARM高級副總裁、首席架構師兼技術院士Richard Grisenthwaite介紹,ARMv9繼續使用AArch64作爲基準指令集,但是在其功能上增加了一些非常重要的擴展。

他指出ARMv9有三個主要支柱,即:安全性、AI(機器學習)以及改進的矢量和DSP功能。

亮點一:安全

爲了解決當今最大的技術挑戰——保護全球數據安全,ARMv9架構路線圖引入了ARM機密計算架構(Confidential Compute Architecture, CCA)。

機密計算通過打造基於硬件的安全運行環境來執行計算,保護部分代碼和數據,免於被存取或修改,甚至不受特權軟件的影響。

例如,在ARM TrustZone的基礎上,可以將個人銀行信息與智能手機的社交媒體應用完全分離。ARM CCA的新安全功能意味着,即使社交媒體應用真的感染了惡意軟件,也不會傳播設備其他部分。

ARM CCA還引入動態創建機密領域(Realms的概念,機密領域面向所有應用,運行在獨立於安全或非安全環境之外的環境中,以實現保護數據安全的目的。

例如,在商業應用中,機密領域可以保護系統中商用機密數據和代碼,無論它們正被使用、閒置或正在傳輸中。在雲中,這也意味着保護物理CPU以及運行在第三方代碼旁邊的虛擬化處理器。

此外,ARM持續與谷歌合作開發的內存標籤擴展(MTE)技術,將成爲第一代基於ARMv9-A處理器的一個組成部分。

過去30年中,許多廣爲人知的數據安全漏洞,都是利用計算機如何存儲和調用內存中的數據的漏洞造成的。如果黑客知道一串重要數據的位置,他們就可以用惡意代碼覆蓋它。

MTE使開發人員能夠使用“標籤”鎖定數據串。然後,只有使用正確的密鑰才能訪問該數據,該密鑰由“指針”(負責從內存中調用數據的代碼)持有。實現鎖和密鑰訪問是一個巨大的步驟,不僅可以確保數據的安全,而且還可以保證數據的安全。

亮點二:針對AI機器學習的優化

機器學習是ARMv9的重要組成部分,ARM認爲在未來幾年中,越來越多的機器學習工作負載將變得司空見慣。

爲了滿足這一需求,ARM與富士通合作開發了可伸縮矢量擴展(Scalable Vector Extension, SVE)技術,並驅動了世界上最快的超級計算機“富嶽”。在此基礎上,ARM爲ARMv9開發了SVE2,以便在更廣泛的應用中實現增強的機器學習和數字信號處理能力。

除了增加的各種現代SIMD功能外,SVE和SVE2的優勢還在於其可變的向量大小,範圍覆蓋了128b到2048b,讓其無論在什麼硬件運行,都允許向量的可變粒度爲128b。

如果純粹從向量處理和編程的角度來看,這意味着軟件開發人員將只需要編譯一次其代碼,並且如果將來某個CPU帶有本地的512b SIMD execution pipelines,該代碼將能夠充分利用單元的整個寬度。

同樣,相同的代碼將能夠在具有較低硬件執行寬度能力的保守設計上運行,這對於ARM設計從物聯網、移動到數據中心的CPU而言至關重要。在保留ARM體系結構的32b編碼空間的同時,它還可以完成所有這些工作。然而,類似X86這樣的架構,則需要根據矢量尺寸增加新的指令和擴展。

SVE2增強了對在CPU上本地運行的5G系統、虛擬和增強現實以及機器學習工作負載的處理能力,如:圖像處理和智能家居應用。

未來幾年,ARM將進一步擴展其技術的AI能力,除了在其Mali GPU和Ethos NPU中持續進行AI創新外,還將大幅增強CPU內的矩陣乘法。

亮點三:通過系統設計實現性能最大化

在過去的五年,ARM技術每年都以超過業界的速度提升CPU性能。ARM在新一代架構ARMv9上將保持這個速度,預計未來兩代移動和基礎設施CPU的性能提升將超過30%。

據ARM官方稱,這個數據是根據業界標準評測工具來衡量,30%的算力提升完全是憑藉於本身架構,而不是藉助於製程工藝來實現的。

然而,隨着行業從通用計算向普遍的專用處理髮展,每年兩位數的CPU性能提升是不夠的。除了增強專用處理能力,ARM的全面計算(Total Compute設計方法,將通過集中的系統級硬件和軟件優化以及用例性能的提高,加速總體計算性能。

通過將全面計算的設計原則應用在包含汽車、客戶端、基礎設施和物聯網解決方案的整個IP組合中,ARMv9系統級技術將遍及整個IP解決方案,並改善個別IP。

此外,ARM還在開發多項技術以提高頻率、帶寬、緩存,並降低內存延遲,從而最大限度地提升基於ARMv9的CPU性能。

 

 

ARM欲打破x86壟斷

目前,CPU領域最成功的架構當屬x86,不過x86的成功和統治力在於PC和高性能計算市場,在ARM擅長的智能終端市場並不成功。

近幾年,ARM架構在高性能計算領域取得了一些進展,包括上面提到的“富嶽”超級計算機,以及推出採用ARM架構的多款服務器。

去年,蘋果基於ARM架構推出M1處理器,併成功應用在Macbook Pro電腦上。此外,高通、微軟也在佈局基於ARM架構的電腦處理器和系統。這一系列的舉動,都讓業界看到了x86架構在PC市場的統治地位並非牢不可破。

ARM首席執行官Simon Segars說,“ARM芯片實現1000億顆的出貨花了26年,如果預測準確,接下來一年,我們的合作伙伴出貨的ARM芯片將累計達到2000億顆。也就是說,我們的第二個1000億的出貨將在短短5年內達成。”

據媒體報道,目前ARM架構的芯片出貨已經超過1800億顆,ARMv9架構會成爲實現ARM芯片3000億顆芯片出貨的先驅。

沒有人能準確預估ARM實現第三個1000億顆芯片出貨的時間,但可以明確的是,ARM希望其芯片能夠爲所有智能計算提供算力,也就是讓其芯片在未來無處不在。

現在看來,在複雜的國際形勢下,同屬精簡指令集的RISC-V正在快速發展,加上x86陣營Intel和AMD也在加強x86的競爭力,ARM要真正撼動x86的優勢領域並非易事。

 

 

華爲能否獲得ARMv9授權?

不過,相比於ARMv9到底更新了哪些功能,國內關注更多的還是華爲能否獲得ARMv9的授權。

據悉,華爲自主研發的海思芯片就是基於ARM架構設計的。在美國出臺芯片禁令之時,華爲方面表示,已經獲得了ARMv8架構授權,可以自主設計處理器,並掌握到核心技術。

雖然華爲掌握着ARMv8架構,但沒有最新構架的支持,華爲也將陷入停滯不前的狀態。

對於ARMv9是否以供給包括華爲在內的中國企業的問題,ARM的官方回覆是:

“ARM既有源於美國的IP,也有非源於美國的IP。經過全面的審查,ARM確定其ARMv9架構不受美國出口管理條例(EAR)的約束。ARM已將此通知美國政府相關部門,我們將繼續遵守美國商務部針對華爲及其附屬公司海思的指導方針。”

細品這番發言,ARM的態度實在是模棱兩可:

  • ARM官方沒有說任何關於ARMv9可以授權給華爲的事情。

第二,從ARM官網上可以看到,谷歌、英偉達、高通、小米、OPPO、VIVO、聯發科、臺積電都是ARM的合作伙伴,但是華爲卻不見蹤影,可見這件事背後,還是有一些隱情。

換句話說,華爲能否得到ARMv9的授權,其實還是一個未知數。

另一方面,即使華爲得到v9的授權,但芯片製造依然是一個大問題。

同時,國內業界也在擔憂,在ARM新架構之下,快速進軍PC和服務器業務,這會對我國硬件國產化以及系統國產化帶來更大壓力。

 

【關於科技雲報道】

專注於原創的企業級內容行家——科技雲報道。成立於2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信雲、全球雲計算大會官方指定傳播媒體之一。深入原創報道雲計算、大數據、人工智能、區塊鏈等領域。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章