痞子衡嵌入式:簡析i.MXRT1170 Cortex-M4 L-MEM ECC功能特點、開啓步驟、性能影響


  大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是恩智浦i.MXRT1170上Cortex-M4內核的L-MEM ECC功能

  本篇是 《簡析i.MXRT1170 Cortex-M7 FlexRAM ECC功能特點、開啓步驟、性能影響》 的姊妹篇,我們知道i.MXRT1170是雙核MCU,主核Cortex-M7的TCM ECC由FlexRAM模塊負責,那麼從核Cortex-M4的TCM有沒有ECC呢?如果有的話,是由哪個模塊負責的呢?本篇給你解答。
  老規矩先來看一下Cortex-M4下的系統內存映射表,不同類型的存儲由不同的ECC控制器來守護,從表中看,CM4的TCM也是有ECC功能的,ECC功能集成在了L-MEM控制器裏,所以今天我們來聊一聊L-MEM的ECC功能。

一、L-MEM ECC功能簡介

1.1 L-MEM特點

  我們先來看下i.MXRT1170的CM4內核系統框圖,L-MEM是專門爲CM4內核設計的,其管理的TCM空間僅能由CM4訪問。在框圖中,L-MEM中物理SRAM總大小是256KB,細心的你可能發現了上面那張系統內存映射表中還有個256KB OCRAM(M4),這個OCRAM與L-MEM是什麼聯繫?其實它倆指向的是同一塊物理SRAM,只不過CM4內核是從TCM地址空間直接訪問SRAM,而從OCRAM(M4)地址空間去訪問SRAM相當於多繞了一級(速度變慢,所以不建議CM4訪問OCRAM(M4)空間,這個地址空間主要是給CM7訪問的)。
  我們知道支持ECC功能,需要有額外空間來存儲ECC校驗值,那麼L-MEM的ECC校驗值是存在哪裏的呢?關於這個細節在下一節裏展開聊。

1.2 關於ECC設計細節

  關於ECC基本概念,參看《簡析i.MXRT1170 Cortex-M7 FlexRAM ECC功能特點、開啓步驟、性能影響》 的 1.2節,這裏不予贅述。

1.2.1 ECC檢驗能力

  L-MEM中每4bytes數據就會計算出一個ECC校驗值(7bits),ECC校驗值都被放在了ECC RAM區域裏。這裏必須要特別介紹一下ECC RAM區域,不同於FlexRAM ECC會有專門的獨立RAM空間用於存放ECC校驗值,L-MEM的ECC校驗值是緊跟着放在每個32bit數據後面的,用戶訪問到的L-MEM是32bit數據線,但其實芯片內部設計L-MEM是39bit數據線,其中高7bit就是專門用來存放ECC校驗值的。

存儲類型 ECC校驗數據塊大小 ECC校驗值長度 ECC校驗能力
Raw NAND 512 bytes 4 bytes 5-bit檢錯,4-bit糾錯
L-MEM 4bytes 7bits 2-bit檢錯,1-bit糾錯
1.2.2 ECC錯誤觸發處理

  關於ECC錯誤處理,可根據如下MCM寄存器(不要懷疑,L-MEM ECC的控制就是在MCM裏實現的)來操作,首先當然是在LMPECR寄存器中使能multi-bit ECC Error,當有2-bit及以上錯誤發生時,系統會觸發NonMaskableInt_IRQn(中斷號是-14),在中斷處理程序裏找到相應的發生ECC錯誤的地址,對這個地址重新寫一次初始化數據(按ECC校驗塊長度一次性寫入),最後清除LMPEIR寄存器裏的相應狀態位。
  需要注意的是,上述處理流程僅對L-MEM中存放的是普通業務數據且發生ECC錯誤時有效,如果ECC錯誤發生在關鍵代碼段或變量段中,這個處理是不適用的,因爲這種ECC錯誤可能會造成程序崩潰。

Offset Register
400h TCRAML ECC control Register (LMDR0)
404h TCRAMU ECC control register (LMDR1)
480h Local Memory Parity & ECC Control Register (LMPECR)
488h Local Memory Parity & ECC Interrupt Register (LMPEIR)

二、開啓L-MEM ECC的步驟

  L-MEM ECC需要按照標準步驟去開啓,需要特別注意的是開啓ECC操作的代碼不能放在待開啓ECC的L-MEM空間裏,因此不管是XIP還是Non-XIP應用程序,最好是用一個二級loader(這個loader可以鏈接在固定OCRAM1/2空間裏,或者XIP)來完成ECC開啓操作然後再加載應用程序執行。痞子衡給瞭如下示例loader代碼工程,代碼裏主要有四個步驟:

參考代碼:https://github.com/JayHeng/cortex-m-apps/blob/master/apps/coremark_imxrt1176/cm4_loader/loader.c

2.1 激活L-MEM ECC特性

  芯片出廠,默認是沒有激活L-MEM ECC特性的,如果需要開啓L-MEM ECC,需要燒寫efuse,fusemap中0x840[2]對應的是MECC_ENABLE bit,這個bit不僅控制MECC模塊,也同時控制了L-MEM ECC特性,我們需要將這個bit燒寫成1,才能激活L-MEM ECC特性。

2.2 使能L-MEM的ECC

  現在需要使能L-MEM ECC,在i.MXRT1170參考手冊裏的MCM章節可以找到LMDR0/1寄存器定義,其中bit3就是用來分別控制TCRAML(對應ITCM)和TCRAMU(對應DTCM)的ECC開關。特別注意,這裏的MCM模塊寄存器僅能在CM4下被訪問。

  操作函數代碼如下:

void enable_lmem_tcm_ecc(void)
{
    // Check eFuse 0x840[2] - MECC_ENABLE bit
    while (!(OCOTP->HW_OCOTP_FUSE004 & 0x4));

    // MCM->LMPECR[9,1] - Enable TCRAM ECC 1-bit/Multi-bit IRQ
    *(uint32_t *)0xE0080480 |= 0x303;

    // MCM->LMDR0[3] - Enable TCRAML ECC
    *(uint32_t *)0xE0080400 |= 0x0B;        /* Enable CM4 TCRAM_L ECC */
    // MCM->LMDR1[3] - Enable TCRAMU ECC
    *(uint32_t *)0xE0080404 |= 0x0B;        /* Enable CM4 TCRAM_U ECC */
}

2.3 初始化L-MEM的ECC值

  L-MEM ECC開啓了之後,此時還不能隨機訪問L-MEM,因爲初始ECC校驗值還沒有填充,如果這時候去讀L-MEM會產生錯誤。我們首先需要將會用到的L-MEM空間全部初始化一遍(就是以ECC校驗數據塊大小對齊方式從頭到尾寫入一遍,寫入內容不限,正常用全0)。
  操作函數代碼如下:

#define ITCM_START   0x1FFE0000
#define ITCM_SIZE    (128*1024U)
#define DTCM_START   0x20000000
#define DTCM_SIZE    (128*1024U)

void init_lmem_itcm_ecc(void)
{
    for (uint32_t i = 0; i < ITCM_SIZE; i += sizeof(uint32_t))
    {
        *(uint32_t *)(ITCM_START + i) = 0;
    }
}

void init_lmem_dtcm_ecc(void)
{
    for (uint32_t i = 0; i < DTCM_SIZE; i += sizeof(uint32_t))
    {
        *(uint32_t *)(DTCM_START + i) = 0;
    }
}

2.4 加載應用程序執行

  當L-MEM初始ECC校驗值已經被填充之後,此時便可以正常隨機讀寫L-MEM了。如果此時加載的是一個在ITCM裏執行並且data段在DTCM裏的應用程序,可以參考痞子衡前面給出的示例loader工程。
  這是loader工程完整主函數代碼,其中memcpy那一句代碼裏的cm4_app_code是應用程序binary數組(用Python腳本將應用程序工程生成的.bin文件轉換成C語言數組放到loader工程源文件裏)。

#define APP_START 0x1FFE0000U

int main(void)
{
    enable_lmem_tcm_ecc();
    init_lmem_itcm_ecc();
    init_lmem_dtcm_ecc();

    // Copy image to RAM.
    memcpy((void *)APP_START, cm4_app_code, APP_LEN);
    
    uint32_t appStack = *(uint32_t *)(APP_START);
    uint32_t appEntry = *(uint32_t *)(APP_START + 4);

    // Turn off interrupts.
    __disable_irq();

    // Set the VTOR to default.
    SCB->VTOR = APP_START;

    // Memory barriers for good measure.
    __ISB();
    __DSB();

    // Set main stack pointer and process stack pointer.
    __set_MSP(appStack);
    __set_PSP(appStack);

    // Jump to app entry point, does not return.
    void (*entry)(void) = (void (*)(void))appEntry;
    entry();
}

三、ECC對內存訪問性能的影響

  L-MEM開了ECC後,訪問性能會有一定降低,畢竟數據訪問中插入了額外的ECC校驗工作,不過據說影響非常小。我們來做個測試,痞子衡就用經典的benchmark程序(Coremark)來測試ECC對L-MEM的影響,測試工程如下:

Coremark工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/coremark_imxrt1176/bsp/build7804_cm4_loader

  需要特別提醒的是,我們知道i.MXRT1170 CM4內核最高可以配置到480MHz,但是開了L-MEM ECC後,爲了保證訪問可靠性,此時CM4內核最好是工作在360MHz,下面的coremark結果也是在360MHz主頻下得到的:

Benchmark類型 L-MEM ECC開關 Benchmark結果
coremark 關閉 Total ticks : 813867
Total time (secs): 25.433344
Iterations/Sec : 1179.553907
Iterations : 30000
CoreMark 1.0 : 1179.553907
coremark 開啓 Total ticks : 813868
Total time (secs): 25.433375
Iterations/Sec : 1179.552458
Iterations : 30000
CoreMark 1.0 : 1179.552458

  從benchmark結果來看,ECC是否開啓對性能影響特別小,可以忽略,當然benchmark測試並不是特別精確地反映了性能影響,底下有空痞子衡會再專門用memcpy函數來測試性能影響。

  至此,恩智浦i.MXRT1170上Cortex-M4內核的L-MEM ECC功能痞子衡便介紹完畢了,掌聲在哪裏~~~

歡迎訂閱

文章會同時發佈到我的 博客園主頁CSDN主頁微信公衆號 平臺上。

微信搜索"痞子衡嵌入式"或者掃描下面二維碼,就可以在手機上第一時間看了哦。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章