痞子衡嵌入式:簡析i.MXRT1170 Cortex-M7 FlexRAM ECC功能特點、開啟步驟、性能影響

来源:https://www.cnblogs.com/henjay724/archive/2020/04/10/12673731.html
-Advertisement-
Play Games

ECC是“Error Correcting Code”的簡寫,ECC能夠實現錯誤檢查和糾正,含有ECC功能的記憶體一般稱為ECC記憶體,使用了ECC記憶體的系統在穩定性和可靠性上得到很大提升。相比前幾代不帶ECC的i.MXRT10xx型號,新一代i.MXRT1170在ECC上做了全面武裝,從eFuse到F... ...



  大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是恩智浦i.MXRT1170上Cortex-M7內核的FlexRAM ECC功能

  ECC是“Error Correcting Code”的簡寫,ECC能夠實現錯誤檢查和糾正,含有ECC功能的記憶體一般稱為ECC記憶體,使用了ECC記憶體的系統在穩定性和可靠性上得到很大提升。相比前幾代不帶ECC的i.MXRT10xx型號,新一代i.MXRT1170在ECC上做了全面武裝,從eFuse到FlexRAM,從OCRAM到外部存儲空間全都加上了ECC功能。如下表所示,不同類型的存儲由不同的ECC控制器來守護:

  今天痞子衡就先給大家簡單介紹一下i.MXRT1170上Cortex-M7內核下的FlexRAM ECC功能:

一、FlexRAM ECC功能簡介

1.1 FlexRAM v2特點

  i.MXRT1170上的FlexRAM模塊是v2版本,相比i.MXRT10xx上的FlexRAM v1版本,主要就是增加了ECC功能。關於FlexRAM v1基本功能,建議你先閱讀痞子衡之前寫過的文章 《恩智浦i.MX RT1xxx系列MCU外設那些事(2)- 百變星君FlexRAM》,痞子衡今天主要聊v2新增的功能。
  我們知道i.MXRT1170是Cortex-M7和Cortex-M4雙核架構,我們看下它的CM7內核系統框圖,FlexRAM本質上是為CM7內核設計的,因為其管理的TCM空間僅能由CM7訪問的,不過如果將FlexRAM也分配出一部分給OCRAM,這部分OCRAM(即文章開頭memory map表裡從0x20360000開始的空間)其實CM4也能正常訪問。
  在框圖中你還會發現,FlexRAM中物理SRAM總大小是640KB,不是我們知道的可自由配置的512KB,這是因為需要額外128KB RAM來存放ECC校驗值,關於這個細節在下一節里展開聊。

1.2 關於ECC設計細節

  關於ECC,大家最早接觸的應該是ONFI Raw NAND上的應用,NAND Flash因為其物理特性的原因(允許壞塊的存在),必須要包含ECC功能,痞子衡寫過的一篇文章 《並行NAND介面標準(ONFI)及SLC Raw NAND簡介》, 裡面的 2.6 Raw NAND壞塊與ECC 簡單介紹了ECC在Raw NAND上的應用。
  在Raw NAND上,通常是每寫入512bytes數據計算出一個ECC校驗值(4bytes),讀取時也是讀完全部512bytes數據後進行ECC校驗,ECC校驗能力一般用 (n+1) bit檢錯,n bit糾錯 來表達,即這512bytes數據里如果發生n+1 bit及以下的錯誤時能夠檢查出來,如果發生n bit及以下的錯誤時,能夠自動糾正。比如典型的Micron MT29F4G08就是5-bit檢錯,4-bit糾錯。
  但是FlexRAM本質上是RAM,跟Flash(尤其是NAND)讀寫機制不一樣,RAM是隨機地址按Byte讀寫,NAND是以Page為單位順序讀寫,所以NAND上ECC實現機制不適用於RAM。那麼FlexRAM到底採用的是什麼樣的ECC設計呢?

1.2.1 ECC檢驗能力

  好了,不賣關子了,公佈答案。FlexRAM中每4ytes(針對DTCM)或8bytes(針對ITCM/OCRAM)數據就會計算出一個ECC校驗值(7/8bits),ECC校驗值都被放在了ECC RAM里。因為校驗數據塊分割得很小,所以此時不需要提供多bit糾錯能力,FlexRAM採用的是最經典的Single-bit Error Correction and Dual-bit Error Detection(SEC-DED,漢明校驗碼)。關於SEC-DED,你可以去Linux內核里看其在NAND上應用的源碼實現 nand_ecc.c,寫得非常經典。

存儲類型 ECC校驗數據塊大小 ECC校驗值長度 ECC校驗能力
Raw NAND 512 bytes 4 bytes 5-bit檢錯,4-bit糾錯
FlexRAM 4/8 bytes 7/8 bits 2-bit檢錯,1-bit糾錯
1.2.2 ECC RAM分配

  128KB ECC RAM並不是只能用來存儲ECC校驗值的,其也可以當做普通OCRAM來使用,ECC RAM具體功能是根據當前FlexRAM分配以及ECC是否開啟而定的。eFuse里預設的512KB FlexRAM配置是256KB ITCM, 256KB DTCM, 沒有OCRAM。
  在預設FlexRAM配置情況下,如果TCM ECC沒有開啟,那麼128KB ECC RAM全部都是普通OCRAM,其地址空間如下表所示:

  在預設FlexRAM配置情況下,如果TCM ECC已經開啟,那麼128KB ECC RAM全部都用來存儲ECC校驗值,這個區域僅能由FlexRAM模塊內部訪問,用戶無法訪問這128KB區域(不在memory map空間里),畢竟ECC校驗值不能被隨便改。

  如果我們在eFuse或者IOMUXC_GPR寄存器里將FlexRAM配置改掉,分配出一部分給OCRAM(比如256KB TCM, 256KB OCRAM),那這128KB ECC RAM功能分配就稍微複雜一些了。最簡單的情況是TCM和OCRAM ECC都沒有開啟,那麼這128KB ECC RAM還是普通OCRAM,map地址是緊跟在FlexRAM OCRAM後面的,如下表所示:

  如果TCM和OCRAM ECC都開啟了,那麼這128KB ECC RAM就還是全部用來存儲ECC校驗值了,用戶無法訪問。

  如果OCRAM ECC沒有開啟,不管TCM ECC是否開啟,這128KB ECC RAM中本用於存儲OCRAM ECC的區域都將被劃分為普通OCRAM,另一部分用於存儲TCM ECC的區域(無論是否真的要存儲ECC校驗值)用戶則無法訪問。區域劃分比例與OCRAM在總FlexRAM大小中占比保持一致,比如512KB FlexRAM(一共16個bank,每個bank 32KB)劃分出了256KB OCRAM,那麼128KB ECC RAM(也是16個bank,每個bank 8KB)則划出了64KB作為普通OCRAM,如下表所示:

1.2.3 ECC錯誤觸發處理

  ECC錯誤分兩種,分別是1-bit錯誤和2-bit錯誤。從軟體層面來看,1-bit錯誤可以不用管,FlexRAM模塊會自動糾錯。我們主要處理2-bit錯誤,由於2-bit錯誤僅能檢錯,無法糾錯,所以發生了這個錯誤,就意味著讀取的數據不可靠了,需要丟棄並重新寫一次(丟棄之前可以再retry read一次看是否還是報錯)。
  關於ECC錯誤處理,可根據如下FlexRAM寄存器來操作,首先當然是在INT_SIG_EN寄存器中使能multi-bit ECC Error,當有2-bit錯誤發生時,系統會觸發FLEXRAM_IRQn(中斷號是50),在中斷處理程式里找到相應的ECC_MULTI_ERROR_ADDR,對這個地址重新寫一次初始化數據(按ECC校驗塊長度一次性寫入),最後清除INT_STATUS寄存器里的相應狀態位。
  需要註意的是,上述處理流程僅對FlexRAM中存放的是普通業務數據且發生ECC錯誤時有效,如果ECC錯誤發生在關鍵代碼段或變數段中,這個處理是不適用的,因為這種ECC錯誤可能會造成程式崩潰。

Offset Register
10h Interrupt Status Register (INT_STATUS)
14h Interrupt Status Enable Register (INT_STAT_EN)
18h Interrupt Enable Register (INT_SIG_EN)
30h OCRAM multi-bit ECC Error Address Register (OCRAM_ECC_MULTI_ERROR_ADDR)
50h ITCM multi-bit ECC Error Address Register (ITCM_ECC_MULTI_ERROR_ADDR)
6Ch D0TCM multi-bit ECC Error Address Register (D0TCM_ECC_MULTI_ERROR_ADDR)
84h D1TCM multi-bit ECC Error Address Register (D1TCM_ECC_MULTI_ERROR_ADDR)

二、開啟FlexRAM ECC的步驟

  FlexRAM ECC需要按照標準步驟去開啟,需要特別註意的是開啟ECC操作的代碼不能放在待開啟ECC的FlexRAM空間里(比如TCM ECC要開啟,那麼開啟ECC操作的代碼不能使用任何TCM空間),因此不管是XIP還是Non-XIP應用程式,最好是用一個二級loader(這個loader可以鏈接在固定OCRAM1/2空間里,或者XIP)來完成ECC開啟操作然後再載入應用程式執行。痞子衡給瞭如下示例loader代碼工程,代碼里主要有四個步驟:

參考代碼:https://github.com/JayHeng/cortex-m-apps/blob/master/apps/coremark_imxrt1176/loader/loader.c

2.1 使能TCM的RMW(可選)

  如果需要開啟TCM ECC,那麼首先需要在CM7內核寄存器里開啟TCM RMW(Read-Modify-Write)功能,這是ARM的規定,可在 Cortex-M7 Technical RM 手冊里找到相關信息如下。手冊里明確寫了RMW位同時也控制了外部邏輯(即MCU廠商的設計)來支持ECC功能。

  操作函數代碼如下:

void enable_cm7_tcm_rmw(void)
{
    SCB->ITCMCR |= SCB_ITCMCR_RMW_Msk;
    SCB->DTCMCR |= SCB_DTCMCR_RMW_Msk;
}

2.2 使能FlexRAM的ECC

  現在需要開啟FlexRAM ECC,在i.MXRT1170參考手冊里的FlexRAM章節可以找到FLEXRAM_CTRL寄存器定義,其中bit5和bit4就是用來分別控制TCM和OCRAM的ECC開關。

  操作函數代碼如下:

void enable_flexram_tcm_ecc(void)
{
    *(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 5);
}

void enable_flexram_ocram_ecc(void)
{
    *(uint32_t *)(FLEXRAM_BASE + 0x108) |= (1u << 4);
}

2.3 初始化FlexRAM的ECC值

  FlexRAM ECC開啟了之後,此時還不能隨機訪問FlexRAM,因為初始ECC校驗值還沒有填充,如果這時候去讀FlexRAM會產生錯誤。我們首先需要將會用到的FlexRAM空間全部初始化一遍(就是以ECC校驗數據塊大小對齊方式從頭到尾寫入一遍,寫入內容不限,正常用全0)。
  操作函數代碼如下:

#define ITCM_START   0x00000000
#define ITCM_SIZE    (256*1024U)  //只是示例長度,根據實際情況修改
#define DTCM_START   0x20000000
#define DTCM_SIZE    (256*1024U)  //只是示例長度,根據實際情況修改
#define OCRAM_START  0x20360000
#define OCRAM_SIZE   (256*1024U)  //只是示例長度,根據實際情況修改

void init_flexram_itcm_ecc(void)
{
    for (uint32_t i = 0; i < ITCM_SIZE; i += sizeof(uint64_t))
    {
        *(uint64_t *)(ITCM_START + i) = 0;
    }
}

void init_flexram_dtcm_ecc(void)
{
    for (uint32_t i = 0; i < DTCM_SIZE; i += sizeof(uint32_t))
    {
        *(uint32_t *)(DTCM_START + i) = 0;
    }
}

void init_flexram_ocram_ecc(void)
{
    for (uint32_t i = 0; i < OCRAM_SIZE; i += sizeof(uint64_t))
    {
        *(uint64_t *)(OCRAM_START + i) = 0;
    }
}

2.4 載入應用程式執行

  當FlexRAM初始ECC校驗值已經被填充之後,此時便可以正常隨機讀寫FlexRAM了。如果此時載入的是一個在ITCM里執行並且data段在DTCM里的應用程式,可以參考痞子衡前面給出的示例loader工程。
  這是loader工程完整主函數代碼,其中memcpy那一句代碼里的app_code是應用程式binary數組(用Python腳本將應用程式工程生成的.bin文件轉換成C語言數組放到loader工程源文件里)。

#define APP_START 0U

int main(void)
{
    enable_cm7_tcm_ecc();
    enable_flexram_tcm_ecc();
    init_flexram_itcm_ecc();
    init_flexram_dtcm_ecc();

    // Copy image to RAM.
    memcpy((void *)APP_START, app_code, APP_LEN);
    
    uint32_t appStack = *(uint32_t *)(APP_START);
    uint32_t appEntry = *(uint32_t *)(APP_START + 4);

    // Turn off interrupts.
    __disable_irq();

    // Set the VTOR to default.
    SCB->VTOR = APP_START;

    // Memory barriers for good measure.
    __ISB();
    __DSB();

    // Set main stack pointer and process stack pointer.
    __set_MSP(appStack);
    __set_PSP(appStack);

    // Jump to app entry point, does not return.
    void (*entry)(void) = (void (*)(void))appEntry;
    entry();
}

三、ECC對記憶體訪問性能的影響

  FlexRAM開了ECC後,訪問性能會有一定降低,畢竟數據訪問中插入了額外的ECC校驗工作,不過這個影響非常小,因為一次ECC校驗僅增加1-2個機器cycle。下麵是FlexRAM分配出的不同存儲類型的基本情況,其中OCRAM可以被L1 Cache加速,所以從應用程式角度開ECC對其訪問性能影響就更小了,我們主要討論ECC對TCM性能的影響。

FlexRAM分配類型 ECC校驗數據塊大小 匯流排類型 訪問速度 L1 Cache加速
ITCM 8 bytes ITCM_ITF 64-bits 與CM7同頻
DTCM 4 bytes DTCM_ITF 2x32-bit 與CM7同頻
OCRAM 8 bytes AXI64 與CM7頻率的1/4

  為了簡化測試,痞子衡就用經典的benchmark程式(Coremark和Dhrystone)來測試ECC對TCM的影響,測試工程如下:

Coremark工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/coremark_imxrt1176/loader
Dhrystone工程:https://github.com/JayHeng/cortex-m-apps/tree/master/apps/dhrystone_imxrt1176/loader

  需要特別提醒的是,我們知道i.MXRT1170 CM7內核最高可以配置到1GHz,但是開了TCM ECC後,為了保證訪問可靠性,此時CM7內核最好是工作在800MHz,下麵的benchmark結果也是在800MHz主頻下得到的:

Benchmark類型 TCM ECC開關 Benchmark結果
coremark 關閉 Total ticks : 2023600
Total time (secs): 20.236000
Iterations/Sec : 3953.350465
Iterations : 80000
CoreMark 1.0 : 3953.350465
coremark 開啟 Total ticks : 2023657
Total time (secs): 20.236570
Iterations/Sec : 3953.239111
Iterations : 80000
CoreMark 1.0 : 3953.239111
dhrystone 關閉 Dhrystones per Second: 3622138.51
DMIPS: 2061.5472
DMIPS/MHz: 2.0698
dhrystone 開啟 Dhrystones per Second: 3621977.04
DMIPS: 2061.4553
DMIPS/MHz: 2.0697

  從benchmark結果來看,ECC是否開啟對性能影響特別小,可以忽略,當然benchmark測試並不是特別精確地反映了性能影響,底下有空痞子衡會再專門用memcpy函數來測試性能影響。

  至此,恩智浦i.MXRT1170上Cortex-M7內核的FlexRAM ECC功能痞子衡便介紹完畢了,掌聲在哪裡~~~

歡迎訂閱

文章會同時發佈到我的 博客園主頁CSDN主頁微信公眾號 平臺上。

微信搜索"痞子衡嵌入式"或者掃描下麵二維碼,就可以在手機上第一時間看了哦。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 原來的需求是控制項可見時有動畫,不可見的時候沒有動畫,只寫了EnterAction,沒寫ExitAction,以為空間都隱藏了,總不會再有動畫了。剛好該動畫在一個攝像頭獲取的視頻上面,動畫期間視頻有點卡,動畫隱藏了,視頻還是卡,於是弄了一下測試,發現不寫ExitAction動畫還是在動的。 ...
  • 對於varnish來講,對後端主機做健康狀態監測的原理是請求後端主機特定的資源,如果能夠在指定的超時時長內正確響應我們就認為後端主機上健康狀態的,如果不能正確的響應我們就認為該後端主機上不健康的;在varnish中對後端主機做健康狀態監測需要用.probe 來引入一段上下文配置,明確的說明怎麼對後... ...
  • 今天想讓電腦開機後固定時間後重啟,但之前只用過關機的命令,就去查詢資料,並將shutdown的命令用法整體記錄一下。 1 ::取消關機 2 shutdown -a 3 4 ::關機 5 shutdown -s 6 7 ::強行關閉應用程式 8 shutdown -f 9 10 ::控制遠程電腦。 ...
  • 1、用戶 Linux是個多用戶、多任務的操作系統 多個用戶:多個用戶同時登入 多任務:每個用戶可以執行多個任務 用戶: 管理Linux系統而存在的 用戶一般分為用戶名和用戶ID(UID) 用戶名方便管理員使用,用戶ID是唯一區別一個用戶(電腦只識別ID) 文件和進程對應用戶關係 linux里所有的 ...
  • [TOC] 1.MySQL開啟binlog功能 2.登錄到資料庫 3.創建與刪除資料庫 4.查看binlog日誌 5.恢複數據 ...
  • [TOC] 1.環境規劃 | 主機名 | 角色 | IP地址 | | : : | : : | : : | | db01 | MySQL主庫 | 10.0.0.51 | | db02 | MySQL從庫 | 10.0.0.52 | 2.所有MySQL都開啟binlog功能,確保所有MySQL的serv ...
  • apue 最後兩章都是通過一個完整的實例來解釋一些 linux 功能,第20章就是通過一個資料庫實例來解釋文件鎖的使用, 說實話,當時沒興趣,因為滿頁都是源碼和解析,有點看不下去。但是再拾起來硬著頭皮看的時候,發現這哪裡是個小 demo,明明是個五臟俱全的 key-value 資料庫嘛, 而且這個數 ...
  • 徹底卸載: 把如下代碼複製到文本中,尾碼命名為cmd,右鍵,使用管理員方式打開,否則會報錯 需要下載 install_wim_tweak.exe 這個軟體,後面的壓縮包有。 1 @echo off 2 cd /d "%~dp0" 3 echo Uninstalling ... 4 CLS 5 ins ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...