Arm Cortex-M85 RA8系列于2024年11月推出RA8E1和RA8E2兩款新產(chǎn)品。這兩款新產(chǎn)品已正式量產(chǎn)上市,將高算力的RA8系列擴(kuò)展到入門級(jí)領(lǐng)域的應(yīng)用,降低BOM成本,擴(kuò)大RA8高性能產(chǎn)品線。
● RA8E1:面向高性能入門級(jí)通用型應(yīng)用。360MHz Arm Cortex-M85內(nèi)核,集成Helium、TrustZone及優(yōu)化的外設(shè)接口。
● RA8E2:面向高性能入門級(jí)圖形顯示應(yīng)用。480MHz Arm Cortex-M85內(nèi)核,集成Helium、TrustZone及TFT-LCD顯示控制單元,2D繪圖引擎等圖形功能模塊。
RA產(chǎn)品陣容
Helium
Helium技術(shù)是Arm公司為Cortex-M系列處理器引入的向量擴(kuò)展,正式名稱是Armv8.1-M M-Profile Vector Extension(MVE)向量擴(kuò)展。Helium技術(shù)適用于需要高效數(shù)據(jù)處理的嵌入式設(shè)備,特別是物聯(lián)網(wǎng)、可穿戴設(shè)備、音頻處理、圖像處理、邊緣AI等領(lǐng)域。目的是提升它們的數(shù)字信號(hào)處理(DSP)和機(jī)器學(xué)習(xí)(ML)任務(wù)的性能,同時(shí)保持低功耗。通過Helium,Cortex-M處理器可以在保持低功耗的同時(shí)執(zhí)行高效的計(jì)算任務(wù),拓寬了嵌入式系統(tǒng)的應(yīng)用場(chǎng)景。
Helium和Cortex-A內(nèi)核MPU中的Neon有很多相似之處。Neon和Helium都使用FPU中的寄存器作為矢量寄存器。兩者都使用128位向量,并且許多向量處理指令對(duì)于兩種體系結(jié)構(gòu)都是通用的。然而,Helium是一種全新的設(shè)計(jì),可在小型處理器中實(shí)現(xiàn)高效的信號(hào)處理性能。它為嵌入式用例提供了許多新的架構(gòu)功能,因?yàn)樗槍?duì)面積(成本)和功耗進(jìn)行了優(yōu)化,為M-Profile架構(gòu)帶來了類似Neon的功能(Cortex-A的SIMD注指令)。Helium經(jīng)過優(yōu)化,可有效利用較小Cortex-M內(nèi)核中的所有可用硬件。下表詳細(xì)的給出了Helium和Neon之間的對(duì)比信息。
Helium與Neon對(duì)比表
注:SIMD(Single Instruction Multiple Data)即單指令多數(shù)據(jù),表示在該硬件中的多個(gè)處理單元中可以同時(shí)對(duì)多個(gè)數(shù)據(jù)項(xiàng)執(zhí)行相同的操作,也就是說,CPU可以同時(shí)執(zhí)行并行計(jì)算,但只有一個(gè)指令正在執(zhí)行。這是數(shù)據(jù)級(jí)的并行。
目前有許多系統(tǒng)將Cortex-M處理器和專用可編程的DSP處理器結(jié)合來使用。Helium允許這樣的系統(tǒng)只用一個(gè)處理器來實(shí)現(xiàn)。這樣做有如下優(yōu)點(diǎn):
● 從軟件開發(fā)的角度來看,它允許使用單個(gè)工具鏈,而不是分別對(duì)CPU和DSP使用各自的編譯器和調(diào)試器。這就意味著程序員只需要熟悉一種架構(gòu)。
●消除了對(duì)處理器間通信的需求,這點(diǎn)可能非常重要,因?yàn)橐獙?duì)實(shí)時(shí)交互的兩個(gè)正在運(yùn)行的處理器中的不同軟件進(jìn)行調(diào)試,既困難也耗時(shí)。
● Cortex-M系列的CPU相比專用DSP而言,更易于編程。
在硬件設(shè)計(jì)層面,使用一個(gè)處理器(而不是兩個(gè)處理器)可以簡(jiǎn)化系統(tǒng),從而減少芯片面積和成本,并縮短開發(fā)周期。
Helium寄存器是128位的,一共有8個(gè),寄存器數(shù)量不可修改。它和浮點(diǎn)單元(FPU)共用硬件物理單元。在FPU中使用S0~S31來訪問32個(gè)單精度(32位)寄存器,同樣的硬件寄存器也可看做16個(gè)雙精度(64位)寄存器D0~D15。D0和S0、S1共用64位相同的硬件寄存器。在Helium架構(gòu)中,Helium使用8個(gè)矢量寄存器Q0~Q7。這就意味著,Helium寄存器Q0和浮點(diǎn)寄存器S0~S3,D0~D1使用相同的物理寄存器,Q1和浮點(diǎn)寄存器S4~S7,D2~D3使用相同的物理寄存器,其他Helium寄存器以此類推。因?yàn)镠elium寄存器重用了標(biāo)量FPU寄存器,所以當(dāng)發(fā)生異常時(shí)無須使用額外的資源去保存和恢復(fù)這些寄存器(同樣不影響中斷延遲)。
每個(gè)Helium寄存器都可以劃分為8位,16位,32位寬的通道。每個(gè)通道可以被一條指令看作:
● 整型數(shù)值(8/16/32位寬)
● 定點(diǎn)飽和值(Q7/Q15/Q31)
● 浮點(diǎn)數(shù)值(半精度FP16/單精度FP32)
下圖是一個(gè)矢量寄存器相加的示例。Helium寄存器q5和q0都是8個(gè)int16的元素?cái)?shù)據(jù)(8個(gè)通道),將他們相加的結(jié)果存在q0中。
矢量寄存器相加示例
Helium允許矢量中的每個(gè)通道有條件地執(zhí)行,這稱作通道預(yù)測(cè)。矢量預(yù)測(cè)狀態(tài)和控制寄存器(VPR)保存每個(gè)通道的條件值。某些矢量指令(比如矢量比較VCMP)可以改變VPR中的條件值,當(dāng)這些條件值被設(shè)置好以后,接下來就可以使用VPT(矢量條件預(yù)測(cè))指令,以每個(gè)通道為基礎(chǔ)在矢量預(yù)測(cè)中實(shí)現(xiàn)條件執(zhí)行。
TCM
TCM(Tightly Coupled Memory,緊耦合內(nèi)存)是一種用于嵌入式系統(tǒng)中的高性能內(nèi)存結(jié)構(gòu),主要用于存儲(chǔ)關(guān)鍵的數(shù)據(jù)或代碼,減少訪問延遲。TCM通常與處理器內(nèi)核緊密連接,能夠?qū)崿F(xiàn)快速訪問,與主存(如SRAM)相比,它具有更低的延遲和更高的帶寬。
TCM的關(guān)鍵特性
1. 低延遲高帶寬
TCM直接連接到CPU核心(通過高帶寬、低延遲的路徑),允許處理器以更高的速度訪問數(shù)據(jù),適合實(shí)時(shí)性要求高的應(yīng)用,如電機(jī)控制算法,數(shù)字電源,通信,視頻/音頻信號(hào)處理等。
2. 可預(yù)測(cè)性
TCM是一種確定性內(nèi)存,與緩存不同,它沒有不確定的替換策略或不確定的訪問延遲。這種特性對(duì)于實(shí)時(shí)系統(tǒng)非常重要,可以確保系統(tǒng)的響應(yīng)時(shí)間。
3. 代碼和數(shù)據(jù)分離
TCM通常分為ITCM(指令緊耦合內(nèi)存)和DTCM(數(shù)據(jù)緊耦合內(nèi)存),分別用于存儲(chǔ)代碼和數(shù)據(jù)。這種分離可以有效避免代碼和數(shù)據(jù)訪問之間的資源爭(zhēng)用,進(jìn)一步提高性能。
CPU框圖
2D Drawing Engine(RA8E2特有)
2D Drawing Engine(二維繪圖引擎,DRW)是一種專門設(shè)計(jì)的硬件模塊,用于加速圖形界面的繪制任務(wù),尤其是在嵌入式系統(tǒng)、工業(yè)控制、家電顯示屏等圖形密集型應(yīng)用中。這種引擎能夠顯著提高圖形處理的效率,同時(shí)減輕MCU的運(yùn)算負(fù)擔(dān)。
2D Drawing Engine的關(guān)鍵功能
1. 基本圖形繪制加速
2D繪圖引擎通常可以加速基本的圖形繪制操作,比如線條、矩形、圓形、多邊形等。通過硬件加速,這些圖形能夠快速呈現(xiàn)在屏幕上,而不必依賴軟件逐點(diǎn)繪制。
2. 圖像和紋理的拷貝與縮放
2D繪圖引擎能夠?qū)D像或紋理進(jìn)行高效的拷貝、縮放、旋轉(zhuǎn)等操作。比如在用戶界面上實(shí)現(xiàn)圖標(biāo)縮放、背景圖的平滑移動(dòng)等效果。
3. 位塊傳輸(BitBLT)
用于將圖像數(shù)據(jù)從一個(gè)區(qū)域快速復(fù)制到另一個(gè)區(qū)域。這對(duì)UI界面更新非常重要,可以加速圖形元素的刷新和移動(dòng),減少閃爍感。
4. 顏色填充和漸變填充
可以快速填充顏色或?qū)崿F(xiàn)顏色漸變填充。漸變填充可以幫助設(shè)計(jì)更豐富的UI界面,比如背景的漸變效果和按鈕的漸變光澤。
5. 抗鋸齒和銳化
2D繪圖引擎支持抗鋸齒技術(shù),確保圖形邊緣更加平滑,提升視覺效果。
繪圖對(duì)象示例
2D繪圖引擎規(guī)格
典型應(yīng)用場(chǎng)景
1. 用戶界面
在智能家電、工業(yè)儀表、汽車信息娛樂系統(tǒng)等需要GUI界面的設(shè)備上,2D繪圖引擎可以加速圖形元素的繪制,使得界面更加流暢。
2. 圖像渲染
2D繪圖引擎可以用于小型圖像渲染任務(wù),比如顯示簡(jiǎn)單的動(dòng)畫或圖形效果。
2D繪圖引擎通過硬件加速圖形處理,大幅提升繪圖速度,降低CPU負(fù)載,適合資源受限的嵌入式環(huán)境。
總的來說,MCU的2D繪圖引擎提供了高效的圖形處理能力,適用于需要快速繪制的圖形界面應(yīng)用。它在嵌入式系統(tǒng)中起到了平衡性能和功耗的關(guān)鍵作用。
綜上所述,RA8E1和RA8E2作為新質(zhì)生產(chǎn)力在嵌入式系統(tǒng)領(lǐng)域的杰出代表,以其高算力、高性能、高性價(jià)比以及豐富的功能和安全性特點(diǎn),成為安全控制、工業(yè)HMI、智能家電、建筑自動(dòng)化和醫(yī)療監(jiān)護(hù)儀等應(yīng)用領(lǐng)域的理想選擇。
-
處理器
+關(guān)注
關(guān)注
68文章
19405瀏覽量
231159 -
ARM
+關(guān)注
關(guān)注
134文章
9165瀏覽量
369163 -
嵌入式系統(tǒng)
+關(guān)注
關(guān)注
41文章
3624瀏覽量
129747 -
內(nèi)核
+關(guān)注
關(guān)注
3文章
1382瀏覽量
40421 -
瑞薩
+關(guān)注
關(guān)注
35文章
22310瀏覽量
86736
原文標(biāo)題:瑞薩高性能家族入門新品RA8E1,RA8E2性能優(yōu)勢(shì)介紹
文章出處:【微信號(hào):瑞薩MCU小百科,微信公眾號(hào):瑞薩MCU小百科】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論