痞子衡嵌入式:簡析i.MXRT1170 Cortex-M7 FlexRAM ECC功能特點、開啓步驟、性能影響...


  大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是恩智浦i.MXRT1170上Cortex-M7內核的FlexRAM ECC功能

  ECC是“Error Correcting Code”的簡寫,ECC能夠實現錯誤檢查和糾正,含有ECC功能的內存一般稱爲ECC內存,使用了ECC內存的系統在穩定性和可靠性上得到很大提升。相比前幾代不帶ECC的i.MXRT10xx型號,新一代i.MXRT1170在ECC上做了全面武裝,從eFuse到FlexRAM,從OCRAM到外部存儲空間全都加上了ECC功能。如下表所示,不同類型的存儲由不同的ECC控制器來守護:

format,png

  今天痞子衡就先給大家簡單介紹一下i.MXRT1170上Cortex-M7內核下的FlexRAM ECC功能:

一、FlexRAM ECC功能簡介

1.1 FlexRAM v2特點

  i.MXRT1170上的FlexRAM模塊是v2版本,相比i.MXRT10xx上的FlexRAM v1版本,主要就是增加了ECC功能。關於FlexRAM v1基本功能,建議你先閱讀痞子衡之前寫過的文章 《恩智浦i.MX RT1xxx系列MCU外設那些事(2)- 百變星君FlexRAM》,痞子衡今天主要聊v2新增的功能。
  我們知道i.MXRT1170是Cortex-M7和Cortex-M4雙核架構,我們看下它的CM7內核系統框圖,FlexRAM本質上是爲CM7內核設計的,因爲其管理的TCM空間僅能由CM7訪問的,不過如果將FlexRAM也分配出一部分給OCRAM,這部分OCRAM(即文章開頭memory map表裏從0x20360000開始的空間)其實CM4也能正常訪問。
  在框圖中你還會發現,FlexRAM中物理SRAM總大小是640KB,不是我們知道的可自由配置的512KB,這是因爲需要額外128KB RAM來存放ECC校驗值,關於這個細節在下一節裏展開聊。

format,png

1.2 關於ECC設計細節

  關於ECC,大家最早接觸的應該是ONFI Raw NAND上的應用,NAND Flash因爲其物理特性的原因(允許壞塊的存在),必須要包含ECC功能,痞子衡寫過的一篇文章 《並行NAND接口標準(ONFI)及SLC Raw NAND簡介》, 裏面的 2.6 Raw NAND壞塊與ECC 簡單介紹了ECC在Raw NAND上的應用。
  在Raw NAND上,通常是每寫入512bytes數據計算出一個ECC校驗值(4bytes),讀取時也是讀完全部512bytes數據後進行ECC校驗,ECC校驗能力一般用 (n+1) bit檢錯,n bit糾錯 來表達,即這512bytes數據裏如果發生n+1 bit及以下的錯誤時能夠檢查出來,如果發生n bit及以下的錯誤時,能夠自動糾正。比如典型的Micron MT29F4G08就是5-bit檢錯,4-bit糾錯。
  但是FlexRAM本質上是RAM,跟Flash(尤其是NAND)讀寫機制不一樣,RAM是隨機地址按Byte讀寫,NAND是以Page爲單位順序讀寫,所以NAND上ECC實現機制不適用於RAM。那麼FlexRAM到底採用的是什麼樣的ECC設計呢?

1.2.1 ECC檢驗能力

  好了,不賣關子了,公佈答案。FlexRAM中每4ytes(針對DTCM)或8bytes(針對ITCM/OCRAM)數據就會計算出一個ECC校驗值(7/8bits),ECC校驗值都被放在了ECC RAM裏。因爲校驗數據塊分割得很小,所以此時不需要提供多bit糾錯能力,FlexRAM採用的是最經典的Single-bit Error Correction and Dual-bit Error Detection(SEC-DED,漢明校驗碼)。關於SEC-DED,你可以去Linux內核裏看其在NAND上應用的源碼實現 nand_ecc.c,寫得非常經典。

存儲類型 ECC校驗數據塊大小 ECC校驗值長度 ECC校驗能力
Raw NAND 512 bytes 4 bytes 5-bit檢錯,4-bit糾錯
FlexRAM 4/8 bytes 7/8 bits 2-bit檢錯,1-bit糾錯
1.2.2 ECC RAM分配

  128KB ECC RAM並不是只能用來存儲ECC校驗值的,其也可以當做普通OCRAM來使用,ECC RAM具體功能是根據當前FlexRAM分配以及ECC是否開啓而定的。eFuse裏默認的512KB FlexRAM配置是256KB ITCM, 256KB DTCM, 沒有OCRAM。
  在默認FlexRAM配置情況下,如果TCM ECC沒有開啓,那麼128KB ECC RAM全部都是普通OCRAM,其地址空間如下表所示:

format,png

  在默認FlexRAM配置情況下,如果TCM ECC已經開啓,那麼128KB ECC RAM全部都用來存儲ECC校驗值,這個區域僅能由FlexRAM模塊內部訪問,用戶無法訪問這128KB區域(不在memory map空間裏),畢竟ECC校驗值不能被隨便改。

format,png

  如果我們在eFuse或者IOMUXC_GPR寄存器裏將FlexRAM配置改掉,分配出一部分給OCRAM(比如256KB TCM, 256KB OCRAM),那這128KB ECC RAM功能分配就稍微複雜一些了。最簡單的情況是TCM和OCRAM ECC都沒有開啓,那麼這128KB ECC RAM還是普通OCRAM,map地址是緊跟在FlexRAM OCRAM後面的,如下表所示:

format,png

  如果TCM和OCRAM ECC都開啓了,那麼這128KB ECC RAM就還是全部用來存儲ECC校驗值了,用戶無法訪問。

format,png

  如果OCRAM ECC沒有開啓,不管TCM ECC是否開啓,這128KB ECC RAM中本用於存儲OCRAM ECC的區域都將被劃分爲普通OCRAM,另一部分用於存儲TCM ECC的區域(無論是否真的要存儲ECC校驗值)用戶則無法訪問。區域劃分比例與OCRAM在總FlexRAM大小中佔比保持一致,比如512KB FlexRAM(一共16個bank,每個bank 32KB)劃分出了256KB OCRAM,那麼128KB ECC RAM(也是16個bank,每個bank 8KB)則劃出了64KB作爲普通OCRAM,如下表所示:

format,png
1.2.3 ECC錯誤觸發處理

  ECC錯誤分兩種,分別是1-bit錯誤和2-bit錯誤。從軟件層面來看,1-bit錯誤可以不用管,FlexRAM模塊會自動糾錯。我們主要處理2-bit錯誤,由於2-bit錯誤僅能檢錯,無法糾錯,所以發生了這個錯誤,就意味着讀取的數據不可靠了,需要丟棄並重新寫一次(丟棄之前可以再retry read一次看是否還是報錯)。
  關於ECC錯誤處理,可根據如下FlexRAM寄存器來操作,首先當然是在INT_SIG_EN寄存器中使能multi-bit ECC Error,當有2-bit錯誤發生時,系統會觸發FLEXRAM_IRQn(中斷號是50),在中斷處理程序裏找到相應的ECC_MULTI_ERROR_ADDR,對這個地址重新寫一次初始化數據(按ECC校驗塊長度一次性寫入),最後清除INT_STATUS寄存器裏的相應狀態位。
  需要注意的是,上述處理流程僅對FlexRAM中存放的是普通業務數據且發生ECC錯誤時有效,如果ECC錯誤發生在關鍵代碼段或變量段中,這個處理是不適用的,因爲這種ECC錯誤可能會造成程序崩潰。

Offset Register
10h Interrupt Status Register (INT_STATUS)
14h Interrupt Status Enable Register (INT_STAT_EN)
18h Interrupt Enable Register (INT_SIG_EN)
30h OCRAM multi-bit ECC Error Address Register (OCRAM_ECC_MULTI_ERROR_ADDR)
50h ITCM multi-bit ECC Error Address Register (ITCM_ECC_MULTI_ERROR_ADDR)
6Ch D0TCM multi-bit ECC Error Address Register (D0TCM_ECC_MULTI_ERROR_ADDR)
84h D1TCM multi-bit ECC Error Address Register (D1TCM_ECC_MULTI_ERROR_ADDR)

二、開啓FlexRAM ECC的步驟

  FlexRAM ECC需要按照標準步驟去開啓,需要特別注意的是開啓ECC操作的代碼不能放在待開啓ECC的FlexRAM空間裏(比如TCM ECC要開啓,那麼開啓ECC操作的代碼不能使用任何TCM空間),因此不管是XIP還是Non-XIP應用程序,最好是用一個二級loader(這個loader可以鏈接在固定OCRAM1/2空間裏,或者XIP)來完成ECC開啓操作然後再加載應用程序執行。痞子衡給瞭如下示例loader代碼工程,代碼裏主要有四個步驟:

參考代碼:https://github.com/JayHeng/cortex-m-apps/blob/master/apps/coremark_imxrt1176/loader/loader.c

2.1 使能TCM的RMW(可選)

  如果需要開啓TCM ECC,那麼首先需要在CM7內核寄存器裏開啓TCM RMW(Read-Modify-Write)功能,這是ARM的規定,可在 Cortex-M7 Technical RM 手冊裏找到相關信息如下。手冊裏明確寫了RMW位同時也控制了外部邏輯(即MCU廠商的設計)來支持ECC功能。

format,png

  操作函數代碼如下:

void enable_cm7_tcm_rmw(void)
{
    SCB->ITCMCR |= SCB_ITCMCR_RMW_Msk;
    SCB->DTCMCR |= SCB_DTCMCR_RMW_Msk;
}

2.2 使能FlexRAM的ECC

  現在需要開啓FlexRAM ECC,在i.MXRT1170參考手冊裏的FlexRAM章節可以找到FLEXRAM_CTRL寄存器定義,其中bit5和bit4就是用來分別控制TCM和OCRAM的ECC開關。

format,png

  操作函數代碼如下:

void enable_flexram_tcm_ecc(void)
{
    *(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 5);
}

void enable_flexram_ocram_ecc(void)
{
    *(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 4);
}

2.3 初始化FlexRAM的ECC值

  FlexRAM ECC開啓了之後,此時還不能隨機訪問FlexRAM,因爲初始ECC校驗值還沒有填充,如果這時候去讀FlexRAM會產生錯誤。我們首先需要將會用到的FlexRAM空間全部初始化一遍(就是以ECC校驗數據塊大小對齊方式從頭到尾寫入一遍,寫入內容不限,正常用全0)。
  操作函數代碼如下:

#define ITCM_START   0x00000000
#define ITCM_SIZE    (256*1024U)  //只是示例長度,根據實際情況修改
#define DTCM_START   0x20000000
#define DTCM_SIZE    (256*1024U)  //只是示例長度,根據實際情況修改
#define OCRAM_START  0x20360000
#define OCRAM_SIZE   (256*1024U)  //只是示例長度,根據實際情況修改

void init_flexram_itcm_ecc(void)
{
    for (uint32_t i = 0; i < ITCM_SIZE; i += sizeof(uint64_t))
    {
        *(uint64_t *)(ITCM_START + i) = 0;
    }
}

void init_flexram_dtcm_ecc(void)
{
    for (uint32_t i = 0; i < DTCM_SIZE; i += sizeof(uint32_t))
    {
        *(uint32_t *)(DTCM_START + i) = 0;
    }
}

void init_flexram_ocram_ecc(void)
{
    for (uint32_t i = 0; i < OCRAM_SIZE; i += sizeof(uint64_t))
    {
        *(uint64_t *)(OCRAM_START + i) = 0;
    }
}

2.4 加載應用程序執行

  當FlexRAM初始ECC校驗值已經被填充之後,此時便可以正常隨機讀寫FlexRAM了。如果此時加載的是一個在ITCM裏執行並且data段在DTCM裏的應用程序,可以參考痞子衡前面給出的示例loader工程。
  這是loader工程完整主函數代碼,其中memcpy那一句代碼裏的app_code是應用程序binary數組(用Python腳本將應用程序工程生成的.bin文件轉換成C語言數組放到loader工程源文件裏)。

#define APP_START 0U

int main(void)
{
    enable_cm7_tcm_ecc();
    enable_flexram_tcm_ecc();
    init_flexram_itcm_ecc();
    init_flexram_dtcm_ecc();

    // Copy image to RAM.
    memcpy((void *)APP_START, app_code, APP_LEN);
    
    uint32_t appStack = *(uint32_t *)(APP_START);
    uint32_t appEntry = *(uint32_t *)(APP_START + 4);

    // Turn off interrupts.
    __disable_irq();

    // Set the VTOR to default.
    SCB->VTOR = APP_START;

    // Memory barriers for good measure.
    __ISB();
    __DSB();

    // Set main stack pointer and process stack pointer.
    __set_MSP(appStack);
    __set_PSP(appStack);

    // Jump to app entry point, does not return.
    void (*entry)(void) = (void (*)(void))appEntry;
    entry();
}

三、ECC對內存訪問性能的影響

  FlexRAM開了ECC後,訪問性能會有一定降低,畢竟數據訪問中插入了額外的ECC校驗工作,不過這個影響非常小,因爲一次ECC校驗僅增加1-2個機器cycle。下面是FlexRAM分配出的不同存儲類型的基本情況,其中OCRAM可以被L1 Cache加速,所以從應用程序角度開ECC對其訪問性能影響就更小了,我們主要討論ECC對TCM性能的影響。

FlexRAM分配類型 ECC校驗數據塊大小 總線類型 訪問速度 L1 Cache加速
ITCM 8 bytes ITCM_ITF 64-bits 與CM7同頻
DTCM 4 bytes DTCM_ITF 2x32-bit 與CM7同頻
OCRAM 8 bytes AXI64 與CM7頻率的1/4

  爲了簡化測試,痞子衡就用經典的benchmark程序(Coremark和Dhrystone)來測試ECC對TCM的影響,測試工程如下:

Coremark工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/coremark_imxrt1176/loader
Dhrystone工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/dhrystone_imxrt1176/loader

  需要特別提醒的是,我們知道i.MXRT1170 CM7內核最高可以配置到1GHz,但是開了TCM ECC後,爲了保證訪問可靠性,此時CM7內核最好是工作在800MHz,下面的benchmark結果也是在800MHz主頻下得到的:

Benchmark類型 TCM ECC開關 Benchmark結果
coremark 關閉 Total ticks : 2023600
Total time (secs): 20.236000
Iterations/Sec : 3953.350465
Iterations : 80000
CoreMark 1.0 : 3953.350465
coremark 開啓 Total ticks : 2023657
Total time (secs): 20.236570
Iterations/Sec : 3953.239111
Iterations : 80000
CoreMark 1.0 : 3953.239111
dhrystone 關閉 Dhrystones per Second: 3622138.51
DMIPS: 2061.5472
DMIPS/MHz: 2.0698
dhrystone 開啓 Dhrystones per Second: 3621977.04
DMIPS: 2061.4553
DMIPS/MHz: 2.0697

  從benchmark結果來看,ECC是否開啓對性能影響特別小,可以忽略,當然benchmark測試並不是特別精確地反映了性能影響,底下有空痞子衡會再專門用memcpy函數來測試性能影響。

  至此,恩智浦i.MXRT1170上Cortex-M7內核的FlexRAM ECC功能痞子衡便介紹完畢了,掌聲在哪裏~~~

歡迎訂閱

文章會同時發佈到我的 博客園主頁CSDN主頁微信公衆號 平臺上。

微信搜索"痞子衡嵌入式"或者掃描下面二維碼,就可以在手機上第一時間看了哦。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章