ECC是“Error Correcting Code”的簡寫,ECC能夠實現錯誤檢查和糾正,含有ECC功能的記憶體一般稱為ECC記憶體,使用了ECC記憶體的系統在穩定性和可靠性上得到很大提升。相比前幾代不帶ECC的i.MXRT10xx型號,新一代i.MXRT1170在ECC上做了全面武裝,從eFuse到F... ...
大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是恩智浦i.MXRT1170上Cortex-M7內核的FlexRAM ECC功能。
ECC是“Error Correcting Code”的簡寫,ECC能夠實現錯誤檢查和糾正,含有ECC功能的記憶體一般稱為ECC記憶體,使用了ECC記憶體的系統在穩定性和可靠性上得到很大提升。相比前幾代不帶ECC的i.MXRT10xx型號,新一代i.MXRT1170在ECC上做了全面武裝,從eFuse到FlexRAM,從OCRAM到外部存儲空間全都加上了ECC功能。如下表所示,不同類型的存儲由不同的ECC控制器來守護:
今天痞子衡就先給大家簡單介紹一下i.MXRT1170上Cortex-M7內核下的FlexRAM ECC功能:
一、FlexRAM ECC功能簡介
1.1 FlexRAM v2特點
i.MXRT1170上的FlexRAM模塊是v2版本,相比i.MXRT10xx上的FlexRAM v1版本,主要就是增加了ECC功能。關於FlexRAM v1基本功能,建議你先閱讀痞子衡之前寫過的文章 《恩智浦i.MX RT1xxx系列MCU外設那些事(2)- 百變星君FlexRAM》,痞子衡今天主要聊v2新增的功能。
我們知道i.MXRT1170是Cortex-M7和Cortex-M4雙核架構,我們看下它的CM7內核系統框圖,FlexRAM本質上是為CM7內核設計的,因為其管理的TCM空間僅能由CM7訪問的,不過如果將FlexRAM也分配出一部分給OCRAM,這部分OCRAM(即文章開頭memory map表裡從0x20360000開始的空間)其實CM4也能正常訪問。
在框圖中你還會發現,FlexRAM中物理SRAM總大小是640KB,不是我們知道的可自由配置的512KB,這是因為需要額外128KB RAM來存放ECC校驗值,關於這個細節在下一節里展開聊。
1.2 關於ECC設計細節
關於ECC,大家最早接觸的應該是ONFI Raw NAND上的應用,NAND Flash因為其物理特性的原因(允許壞塊的存在),必須要包含ECC功能,痞子衡寫過的一篇文章 《並行NAND介面標準(ONFI)及SLC Raw NAND簡介》, 裡面的 2.6 Raw NAND壞塊與ECC 簡單介紹了ECC在Raw NAND上的應用。
在Raw NAND上,通常是每寫入512bytes數據計算出一個ECC校驗值(4bytes),讀取時也是讀完全部512bytes數據後進行ECC校驗,ECC校驗能力一般用 (n+1) bit檢錯,n bit糾錯 來表達,即這512bytes數據里如果發生n+1 bit及以下的錯誤時能夠檢查出來,如果發生n bit及以下的錯誤時,能夠自動糾正。比如典型的Micron MT29F4G08就是5-bit檢錯,4-bit糾錯。
但是FlexRAM本質上是RAM,跟Flash(尤其是NAND)讀寫機制不一樣,RAM是隨機地址按Byte讀寫,NAND是以Page為單位順序讀寫,所以NAND上ECC實現機制不適用於RAM。那麼FlexRAM到底採用的是什麼樣的ECC設計呢?
1.2.1 ECC檢驗能力
好了,不賣關子了,公佈答案。FlexRAM中每4ytes(針對DTCM)或8bytes(針對ITCM/OCRAM)數據就會計算出一個ECC校驗值(7/8bits),ECC校驗值都被放在了ECC RAM里。因為校驗數據塊分割得很小,所以此時不需要提供多bit糾錯能力,FlexRAM採用的是最經典的Single-bit Error Correction and Dual-bit Error Detection(SEC-DED,漢明校驗碼)。關於SEC-DED,你可以去Linux內核里看其在NAND上應用的源碼實現 nand_ecc.c,寫得非常經典。
存儲類型 | ECC校驗數據塊大小 | ECC校驗值長度 | ECC校驗能力 |
---|---|---|---|
Raw NAND | 512 bytes | 4 bytes | 5-bit檢錯,4-bit糾錯 |
FlexRAM | 4/8 bytes | 7/8 bits | 2-bit檢錯,1-bit糾錯 |
1.2.2 ECC RAM分配
128KB ECC RAM並不是只能用來存儲ECC校驗值的,其也可以當做普通OCRAM來使用,ECC RAM具體功能是根據當前FlexRAM分配以及ECC是否開啟而定的。eFuse里預設的512KB FlexRAM配置是256KB ITCM, 256KB DTCM, 沒有OCRAM。
在預設FlexRAM配置情況下,如果TCM ECC沒有開啟,那麼128KB ECC RAM全部都是普通OCRAM,其地址空間如下表所示:
在預設FlexRAM配置情況下,如果TCM ECC已經開啟,那麼128KB ECC RAM全部都用來存儲ECC校驗值,這個區域僅能由FlexRAM模塊內部訪問,用戶無法訪問這128KB區域(不在memory map空間里),畢竟ECC校驗值不能被隨便改。
如果我們在eFuse或者IOMUXC_GPR寄存器里將FlexRAM配置改掉,分配出一部分給OCRAM(比如256KB TCM, 256KB OCRAM),那這128KB ECC RAM功能分配就稍微複雜一些了。最簡單的情況是TCM和OCRAM ECC都沒有開啟,那麼這128KB ECC RAM還是普通OCRAM,map地址是緊跟在FlexRAM OCRAM後面的,如下表所示:
如果TCM和OCRAM ECC都開啟了,那麼這128KB ECC RAM就還是全部用來存儲ECC校驗值了,用戶無法訪問。
如果OCRAM ECC沒有開啟,不管TCM ECC是否開啟,這128KB ECC RAM中本用於存儲OCRAM ECC的區域都將被劃分為普通OCRAM,另一部分用於存儲TCM ECC的區域(無論是否真的要存儲ECC校驗值)用戶則無法訪問。區域劃分比例與OCRAM在總FlexRAM大小中占比保持一致,比如512KB FlexRAM(一共16個bank,每個bank 32KB)劃分出了256KB OCRAM,那麼128KB ECC RAM(也是16個bank,每個bank 8KB)則划出了64KB作為普通OCRAM,如下表所示:
1.2.3 ECC錯誤觸發處理
ECC錯誤分兩種,分別是1-bit錯誤和2-bit錯誤。從軟體層面來看,1-bit錯誤可以不用管,FlexRAM模塊會自動糾錯。我們主要處理2-bit錯誤,由於2-bit錯誤僅能檢錯,無法糾錯,所以發生了這個錯誤,就意味著讀取的數據不可靠了,需要丟棄並重新寫一次(丟棄之前可以再retry read一次看是否還是報錯)。
關於ECC錯誤處理,可根據如下FlexRAM寄存器來操作,首先當然是在INT_SIG_EN寄存器中使能multi-bit ECC Error,當有2-bit錯誤發生時,系統會觸發FLEXRAM_IRQn(中斷號是50),在中斷處理程式里找到相應的ECC_MULTI_ERROR_ADDR,對這個地址重新寫一次初始化數據(按ECC校驗塊長度一次性寫入),最後清除INT_STATUS寄存器里的相應狀態位。
需要註意的是,上述處理流程僅對FlexRAM中存放的是普通業務數據且發生ECC錯誤時有效,如果ECC錯誤發生在關鍵代碼段或變數段中,這個處理是不適用的,因為這種ECC錯誤可能會造成程式崩潰。
Offset | Register |
---|---|
10h | Interrupt Status Register (INT_STATUS) |
14h | Interrupt Status Enable Register (INT_STAT_EN) |
18h | Interrupt Enable Register (INT_SIG_EN) |
30h | OCRAM multi-bit ECC Error Address Register (OCRAM_ECC_MULTI_ERROR_ADDR) |
50h | ITCM multi-bit ECC Error Address Register (ITCM_ECC_MULTI_ERROR_ADDR) |
6Ch | D0TCM multi-bit ECC Error Address Register (D0TCM_ECC_MULTI_ERROR_ADDR) |
84h | D1TCM multi-bit ECC Error Address Register (D1TCM_ECC_MULTI_ERROR_ADDR) |
二、開啟FlexRAM ECC的步驟
FlexRAM ECC需要按照標準步驟去開啟,需要特別註意的是開啟ECC操作的代碼不能放在待開啟ECC的FlexRAM空間里(比如TCM ECC要開啟,那麼開啟ECC操作的代碼不能使用任何TCM空間),因此不管是XIP還是Non-XIP應用程式,最好是用一個二級loader(這個loader可以鏈接在固定OCRAM1/2空間里,或者XIP)來完成ECC開啟操作然後再載入應用程式執行。痞子衡給瞭如下示例loader代碼工程,代碼里主要有四個步驟:
參考代碼:https://github.com/JayHeng/cortex-m-apps/blob/master/apps/coremark_imxrt1176/loader/loader.c
2.1 使能TCM的RMW(可選)
如果需要開啟TCM ECC,那麼首先需要在CM7內核寄存器里開啟TCM RMW(Read-Modify-Write)功能,這是ARM的規定,可在 Cortex-M7 Technical RM 手冊里找到相關信息如下。手冊里明確寫了RMW位同時也控制了外部邏輯(即MCU廠商的設計)來支持ECC功能。
操作函數代碼如下:
void enable_cm7_tcm_rmw(void)
{
SCB->ITCMCR |= SCB_ITCMCR_RMW_Msk;
SCB->DTCMCR |= SCB_DTCMCR_RMW_Msk;
}
2.2 使能FlexRAM的ECC
現在需要開啟FlexRAM ECC,在i.MXRT1170參考手冊里的FlexRAM章節可以找到FLEXRAM_CTRL寄存器定義,其中bit5和bit4就是用來分別控制TCM和OCRAM的ECC開關。
操作函數代碼如下:
void enable_flexram_tcm_ecc(void)
{
*(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 5);
}
void enable_flexram_ocram_ecc(void)
{
*(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 4);
}
2.3 初始化FlexRAM的ECC值
FlexRAM ECC開啟了之後,此時還不能隨機訪問FlexRAM,因為初始ECC校驗值還沒有填充,如果這時候去讀FlexRAM會產生錯誤。我們首先需要將會用到的FlexRAM空間全部初始化一遍(就是以ECC校驗數據塊大小對齊方式從頭到尾寫入一遍,寫入內容不限,正常用全0)。
操作函數代碼如下:
#define ITCM_START 0x00000000
#define ITCM_SIZE (256*1024U) //只是示例長度,根據實際情況修改
#define DTCM_START 0x20000000
#define DTCM_SIZE (256*1024U) //只是示例長度,根據實際情況修改
#define OCRAM_START 0x20360000
#define OCRAM_SIZE (256*1024U) //只是示例長度,根據實際情況修改
void init_flexram_itcm_ecc(void)
{
for (uint32_t i = 0; i < ITCM_SIZE; i += sizeof(uint64_t))
{
*(uint64_t *)(ITCM_START + i) = 0;
}
}
void init_flexram_dtcm_ecc(void)
{
for (uint32_t i = 0; i < DTCM_SIZE; i += sizeof(uint32_t))
{
*(uint32_t *)(DTCM_START + i) = 0;
}
}
void init_flexram_ocram_ecc(void)
{
for (uint32_t i = 0; i < OCRAM_SIZE; i += sizeof(uint64_t))
{
*(uint64_t *)(OCRAM_START + i) = 0;
}
}
2.4 載入應用程式執行
當FlexRAM初始ECC校驗值已經被填充之後,此時便可以正常隨機讀寫FlexRAM了。如果此時載入的是一個在ITCM里執行並且data段在DTCM里的應用程式,可以參考痞子衡前面給出的示例loader工程。
這是loader工程完整主函數代碼,其中memcpy那一句代碼里的app_code是應用程式binary數組(用Python腳本將應用程式工程生成的.bin文件轉換成C語言數組放到loader工程源文件里)。
#define APP_START 0U
int main(void)
{
enable_cm7_tcm_ecc();
enable_flexram_tcm_ecc();
init_flexram_itcm_ecc();
init_flexram_dtcm_ecc();
// Copy image to RAM.
memcpy((void *)APP_START, app_code, APP_LEN);
uint32_t appStack = *(uint32_t *)(APP_START);
uint32_t appEntry = *(uint32_t *)(APP_START + 4);
// Turn off interrupts.
__disable_irq();
// Set the VTOR to default.
SCB->VTOR = APP_START;
// Memory barriers for good measure.
__ISB();
__DSB();
// Set main stack pointer and process stack pointer.
__set_MSP(appStack);
__set_PSP(appStack);
// Jump to app entry point, does not return.
void (*entry)(void) = (void (*)(void))appEntry;
entry();
}
三、ECC對記憶體訪問性能的影響
FlexRAM開了ECC後,訪問性能會有一定降低,畢竟數據訪問中插入了額外的ECC校驗工作,不過這個影響非常小,因為一次ECC校驗僅增加1-2個機器cycle。下麵是FlexRAM分配出的不同存儲類型的基本情況,其中OCRAM可以被L1 Cache加速,所以從應用程式角度開ECC對其訪問性能影響就更小了,我們主要討論ECC對TCM性能的影響。
FlexRAM分配類型 | ECC校驗數據塊大小 | 匯流排類型 | 訪問速度 | L1 Cache加速 |
---|---|---|---|---|
ITCM | 8 bytes | ITCM_ITF 64-bits | 與CM7同頻 | 否 |
DTCM | 4 bytes | DTCM_ITF 2x32-bit | 與CM7同頻 | 否 |
OCRAM | 8 bytes | AXI64 | 與CM7頻率的1/4 | 是 |
為了簡化測試,痞子衡就用經典的benchmark程式(Coremark和Dhrystone)來測試ECC對TCM的影響,測試工程如下:
Coremark工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/coremark_imxrt1176/loader
Dhrystone工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/dhrystone_imxrt1176/loader
需要特別提醒的是,我們知道i.MXRT1170 CM7內核最高可以配置到1GHz,但是開了TCM ECC後,為了保證訪問可靠性,此時CM7內核最好是工作在800MHz,下麵的benchmark結果也是在800MHz主頻下得到的:
Benchmark類型 | TCM ECC開關 | Benchmark結果 |
---|---|---|
coremark | 關閉 | Total ticks : 2023600 Total time (secs): 20.236000 Iterations/Sec : 3953.350465 Iterations : 80000 CoreMark 1.0 : 3953.350465 |
coremark | 開啟 | Total ticks : 2023657 Total time (secs): 20.236570 Iterations/Sec : 3953.239111 Iterations : 80000 CoreMark 1.0 : 3953.239111 |
dhrystone | 關閉 | Dhrystones per Second: 3622138.51 DMIPS: 2061.5472 DMIPS/MHz: 2.0698 |
dhrystone | 開啟 | Dhrystones per Second: 3621977.04 DMIPS: 2061.4553 DMIPS/MHz: 2.0697 |
從benchmark結果來看,ECC是否開啟對性能影響特別小,可以忽略,當然benchmark測試並不是特別精確地反映了性能影響,底下有空痞子衡會再專門用memcpy函數來測試性能影響。
至此,恩智浦i.MXRT1170上Cortex-M7內核的FlexRAM ECC功能痞子衡便介紹完畢了,掌聲在哪裡~~~
歡迎訂閱
文章會同時發佈到我的 博客園主頁、CSDN主頁、微信公眾號 平臺上。
微信搜索"痞子衡嵌入式"或者掃描下麵二維碼,就可以在手機上第一時間看了哦。