ARMv7的Cortex系列微處理器技術特點

隨着嵌入式技術應用領域的不斷擴展,對嵌入式系統的要求越來越高,而作爲嵌入式系統核心的微處理器也面臨日益嚴竣的挑戰。ARM公司從成立以來,一直以知識產權(IP,Intelligence Property)提供者的身份出售知識產權,在32位RISC CPU開發領域中不斷取得突破,其設計的微處理器結構已經從v3發展到現在的v7。Cortex系列處理器是基於ARMv7架構的,分爲Cortex-M、Cortex-R和Cortex-A三類。ARM系列微處理器的核心及體系結構如表1所列。

1 ARM Cortex處理器技術特點

ARMv7架構是在ARMv6架構的基礎上誕生的。該架構採用了Thumb-2技術,它是在ARM的Thumb代碼壓縮技術的基礎上發展起來的,並且保持了對現存ARM解決方案的完整的代碼兼容性。Thumb-2技術比純32位代碼少使用31%的內存,減小了系統開銷。同時能夠提供比已有的基於Thumb技術的解決方案高出38%的性能。ARMv7架構還採用了NEON技術,將DSP和媒體處理能力提高了近4倍,並支持改良的浮點運算,滿足下一代3D圖形、遊戲物理應用以及傳統嵌入式控制應用的需求。此外,ARMv7還支持改良的運行環境,以迎合不斷增加的JIT(Just In Time)和DAC(DynamicAdaptive Compilation)技術的使用。

在與早期的ARM處理器軟件兼容性方面,ARMv7架構在設計時充分考慮到了。ARM Cortex-M系列支持Thumb-2指令集(Thumb指令集的擴展集),可以執行所有已存的爲早期處理器編寫的代碼。通過一個前向的轉換方式,爲ARM Cortex-M系列處理器所寫的用戶代碼可以與ARM Cortex-R系列微處理器完全兼容。ARMCortex-M系列系統代碼(如實時操作系統)可以很容易地移植到基於ARM Cortex-R系列的系統上。ARMCortex-A和Cortex-R系列處理器還支持ARM 32位指令集,向後完全兼容早期的ARM處理器,包括從1995年發佈的ARM7TDMI處理器到2002年發佈的ARMll處理器系列。圖1爲v5~v7架構的處理器技術比較。由於應用領域的不同,基於v7架構的Cortex處理器系列所採用的技術也不相同。

 

在命名方式上,基於ARMv7架構的ARM處理器已經不再延用過去的數字命名方式,而是冠以Cortex的代號。基於v7A的稱爲"Cortex-A系列",基於v7R的稱爲"Cortex-R系列",基於v7M的稱爲"Cortex-M3"。

2 ARM Cortex-M3處理器技術特點

ARM Cortex-M3處理器是爲存儲器和處理器的尺寸對產品成本影響極大的各種應用專門開發設計的,其結構如圖2所示。它整合了多種技術,減少使用內存,並在極小的RISC內核上提供低功耗和高性能,可實現由以往的代碼向32位微控制器的快速移植。ARM Cortex-M3處理器是使用最少門數的ARM CPU,相對於過去的設計大大減小了芯片面積,可減小裝置的體積或採用更低成本的工藝進行生產,僅33 000門的內核性能可達1.2DMIPS/MHz。此外,基本系統外設還具備高度集成化特點,集成了許多緊耦合系統外設,合理利用了芯片空間,使系統滿足下一代產品的控制需求。

ARM Cortex-M3處理器結合了執行Thumb-2指令的32位哈佛微體系結構和系統外設,包括Nested Vec-tored Interrupt Controller和Arbiter總線。該技術方案在測試和實例應用中表現出較高的性能:在臺機電180 nm工藝下,芯片性能達1.2 DMIPS/MHz,時鐘頻率高達100 MHz。Cortex-M3處理器還實現了Tail-Chaining中斷技術。該技術是一項完全基於硬件的中斷處理技術,最多可減少12個時鐘週期數,在實際應用中可減少70%中斷;推出了新的單線調試技術,避免使用多引腳進行JTAG調試,並全面支持RealView編譯器和RealView調試產品。RealView工具向設計者提供模擬、創建虛擬模型、編譯軟件、調試、驗證和測試基於ARMv7架構的系統等功能。

爲微控制器應用而開發的Cortex-M3擁有以下性能:

實現單週期Flash應用最優化;

準確快速地中斷處理,永不超過12週期,僅6週期tail-chaining(末尾連鎖);

有低功耗時鐘門控(Clock Cating)的3種睡眠模式;

單週期乘法和乘法累加指令;

ARM Thumb-2混合的16/32位同有指令集,無模式轉換;

包括數據觀察點和Flash補丁在內的高級調試功能;

原子位操作,在一個單一指令中讀取/修改/編寫;

1.25 DMIPS/MHz(與O.9DMIPS/MHz的ARM7和1.1 DMIPS/MHz的ARM9相比)。

3 ARM Cortex-R處理器技術特點

ARM Cortex-R系列處理器目前包括ARM Cortex-R4和ARM Cortex-R4F兩個型號,主要適用於實時系統的嵌入式處理器。

3.1 ARM Cortex-R4處理器技術特點

Cortex-R4處理器結構如圖3所示。該處理器支持手機、硬盤、打印機及汽車電子設計,能協助新一代嵌入式產品快速執行各種複雜的控制算法與實時工作的運算;可通過內存保護單元(MPU,Memory Protection Unit)、高速緩存以及緊密耦合內存(TCM,Tightly Coupled Memory)讓處理器針對各種不同的嵌入式應用進行最佳化調整,且不影響基本的ARM指令集兼容性。這種設計能夠在延用原有程序代碼的情況下,降低系統的成本與複雜度,同時其緊密耦合內存功能也能提供更小的規格及更高效率的整合,並帶來快速的響應時間。

Cortex-R4處理器採用ARMv7體系結構,讓它能與現有的程序維持完全的回溯兼容性,能支持現今建立在全球各地數十億的系統;並已針對Thumb-2指令進行最佳化設計。此項特性帶來很多的利益,其中包括:更低的時鐘速度所帶來的省電效益;更高的性能將各種多功能特色帶人移動電話與汽車產品的設計;更復雜的算法支持更高性能的數碼影像與內建硬盤的系統。運用Thumb-2指令集,加上RealView開發套件,使芯片內部存儲器的容量最多得以降低30%,大幅降低系統成本,其速度比在ARM946E-S處理器所使用的Thumb指令集高出40%。由於存儲器在芯片中的佔用空間愈來愈多,因此這項設計將大幅節省芯片容量,讓芯片製造商運用這款處理器開發各種SoC(System on a Chip)器件。

相比於前幾代的處理器,Cortex-R4處理器高效率的設計方案,使其能以更低的時鐘達到更高的性能;經過最佳化設計的Artisan Metro內存,則進一步降低嵌入式系統的體積與成本。處理器搭載一個先進的微架構,具備雙指令發送功能,採用90 nm工藝並搭配Artisan Advantage程序庫的組件,底面積不到1 mm2,耗電量低於0.27mW/MHz,並能提供超過600 DMIPS的性能。

Cortex-R4處理器在各種安全應用上加入容錯功能和內存保護機制,支持最新版OSEK實時操作系統;支持RealView Develop系列軟件開發工具、RealView Create系列ESL工具與模塊,以及Core Sight除錯與追蹤技術,協助設計者迅速開發各種嵌入式系統。

3.2 ARM Cortex-R4F處理器技術特點

Cortex-R4F處理器結構如圖4所示。該處理器擁有針對汽車市場而開發的各項先進功能,包括自動除錯功能、可相互連結的錯誤偵測機制,以及可選擇優化的浮點運算單元(FPU,Floating-Point Unit)。ECC技術能監控內存存取作業,偵測並校正各種錯誤。當發生內存錯誤時,ECC邏輯除通報錯誤並停止系統運作外,還會加以校正。它還擁有Cortex-R4系列的各項先進功能,能夠透過高效能內存保護單元、高速緩存,以及緊密耦合內存,使處理器能針對各種不同的應用進行最佳化調整;同時將傳統處理器中的錯誤偵測功能延伸至整個SoC中,系統會不斷地掃描先前偵錯的資料,以提升系統的可靠度。基於對安全性能的重視,Cortex-R4F處理器特別搭載了高分辨率內存保護機制,能嚴密控制獨立的軟件作業。

Cortex-R4F處理器中執行浮點運算的FPU,提供勝過固定小數點操作數的動態範圍及精準度。該FPU與ARM其他處理器核心之間的FPU均維持回溯兼容性,並針對各種汽車應用常見的單精度處理作業進行優化。使用單倍精度格式,而非雙倍精度的數值資料,不僅能將數據處理速度提升至2倍,更能維持必要的精度以提高SoC設計的效率。

Cortex-R4F處理器採用一套具備雙指令發送功能的先進微架構,透過ARM Artisan Advantage程序庫中針對90 nm工藝的優化,達到超過800 DMIPS的性能水準。Level 1內存鬆散的時序設計,使組件能使用高密度、低功耗的RAM,使在總成本中佔有高比重的內存,能像處理器邏輯一樣擁有節省空間的優勢。在90 nm工藝下,佔用空間不到1 mm2,且耗電量不到0.27 mW/MHz,有效地協助系統開發者降低成本與功耗。該處理器採用ARMv7ISA架構,能與已被全球數十億臺系統所採用的ARM程序代碼維持回溯兼容性,並針對Thumb-2指令集進行最優化設計。運用Thumb-2指令,搭配ARM RealView開發套件,使芯片內部存儲器的容量最大能縮減30%,大幅降低系統成本。此外,相較於內建在ARM946E-S處理器的舊版Thumb指令集,新技術能夠提高40%的工作效能。

4 ARM Cortex-A8處理器技術特點

ARM Cortex-A8處理器是一款適用於複雜操作系統及用戶應用的應用處理器,其結構如圖5所示。支持智能能源管理(IEM,Intelligent Energy Manger)技術的ARM Artisan庫以及先進的泄漏控制技術,使得Cortex-A8處理器實現了非凡的速度和功耗效率。在65 nm上藝下,ARM cortex-A8處理器的功耗不到300 mW,能夠提供高性能和低功耗。它第一次爲低費用、高容量的產品帶來了臺式機級別的性能。

ortex-A8處理器是第一款基於下一代ARMv7架構的應用處理器,使用了能夠帶來更高性能、更低功耗和更高代碼密度的Thumb-2技術。它首次採用了強大的NEON信號處理擴展集,爲H.264和MP3等媒體編解碼提供加速。Cortex-A8的解決方案還包括Jazelle-RCTJava加速技術,對實時(JIT)和動態調整編譯(DAC)提供最優化,同時減少內存佔用空間高達3倍。該處理器配置了先進的超標量體系結構流水線,能夠同時執行多條指令,並且提供超過2.0 DMIPS/MHz的性能。處理器集成了一個可調尺寸的二級高速緩衝存儲器,能夠同高速的16 KB或者32 KB一級高速緩衝存儲器一起工作,從而達到最快的讀取速度和最大的吞吐量。新處理器還配置了用於安全交易和數字版權管理的Trust Zone技術,以及實現低功耗管理的IEM功能。

Cortex-A8處理器使用了先進的分支預測技術,並且具有專用的NEON整型和浮點型流水線進行媒體和信號處理。在使用小於4 mm2的硅片及低功耗的65 nm工藝的情況下,Cortex-A8處理器的運行頻率將高於600MHz(不包括NEON追蹤技術和二級高速緩衝存儲器)。在高性能的90 nm和65 nm工藝下,Cortex-A8處理器運行頻率最高可達1 GHz,能夠滿足高性能消費產品設計的需要。

結 語

這些新的ARM Cortex處理器系列都是基於ARMv7架構的產品,從尺寸和性能方而來看,既有少於33 000個門電路的ARM Cortex-M系列,也有高性能的ARMCortex-A系列。其中,ARM Cortex-A系列是針對日益增長的,運行包括Linux、Windows,CE和Symbian操作系統在內的消費者娛樂和無線產品設計的;ARM Cortex-R系列針對的是需要運行實時操作系統來進行控制應用的系統,包括汽車電子、網絡和影像系統;ARM Cortex-M系列則是爲那些對丌發費用非常敏感同時對性能要求小斷增加的嵌入式應用(如微控制器、汽車車身控制系統和各種大型家電)所設計的。隨着在各種不同領域應用需求的增加,微處理器市場也在趨於多樣化。爲了適應市場的發展變化,基於ARMv7架構的ARM處理器系列將不斷拓展自己的應用領域。

 


 
本文摘自《單片機與嵌入式系統應用》
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章