痞子衡嵌入式:16MB以上NOR Flash使用不當可能會造成軟複位後i.MXRT無法正常啟動

来源:https://www.cnblogs.com/henjay724/archive/2020/07/24/13374775.html
-Advertisement-
Play Games

痞子衡這幾天在支持一個i.MXRT1050客戶項目,客戶遇到了軟複位無法從32MB NOR Flash重新啟動的問題。這個客戶是做醫療設備的,已經基於i.MXRT做出一款成功的產品了,所以客戶其實有豐富的i.MXRT使用經驗。目前調試的項目是客戶的第二款產品,這個軟複位無法啟動問題已經困擾他們很久,... ...



  大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是i.MXRT上使用16MB以上NOR Flash軟複位無法正常啟動問題的分析解決經驗

  痞子衡這幾天在支持一個i.MXRT1050客戶項目,客戶遇到了軟複位無法從32MB NOR Flash重新啟動的問題。這個客戶是做醫療設備的,已經基於i.MXRT做出一款成功的產品了,所以客戶其實有豐富的i.MXRT使用經驗。目前調試的項目是客戶的第二款產品,這個軟複位無法啟動問題已經困擾他們很久,但問題畢竟不是特別緊急,不影響他們開發進度,所以耽擱至今。這次客戶趁著出差蘇州參加勞特巴赫TRACE32調試器培訓機會,讓痞子衡現場幫他們定位問題,經過一番調試和分析,痞子衡終於成功地解決了問題,特此將問題解決的全過程記錄下來,供大家參考。

一、問題描述

  在描述問題前,首先給大家介紹下客戶的項目設計,底下是客戶硬體簡圖。客戶選用的i.MXRT1052作為主控,掛載了兩個QSPI Flash,FlexSPI介面連接的32MB Flash用於啟動和存放靜態圖片資源(只需要讀即可),LPSPI介面連接的1MB Flash用於存放運行時狀態數據(需要讀寫),此外板子連接了一個顯示屏,所以還掛載一片SDRAM用於顯示緩存,其實SDRAM除了顯示緩存功能之外,還用於執行App(QSPI Flash里的App會自載入到SDRAM執行)。

  有必要重點介紹下QSPI Flash啟動設計細節,客戶選用的Flash型號是ISSI的IS25WP256D,這是一款容量256Mb的四線串列Flash。客戶啟動流程設計的挺複雜,晶元上電之後,BootROM負責從Flash中XIP啟動L2 loader程式,L2 loader運行後從Flash中選出最新的一份Boot程式(A/B是雙備份),將其載入到SDRAM中執行。Boot程式運行後做一些系統初始化工作,然後直接跳轉到App中執行(XIP),App才是最終的客戶應用程式,這個應用程式會完成往SDRAM的自拷貝以及跳轉執行。

  客戶的App實際大小接近5MB,對於嵌入式程式來說,這個體量相當大了,這也是為什麼客戶需要藉助專業的勞特巴赫TRACE32調試器來分析定位程式邏輯設計問題。從下圖還可以看到從0x60800000開始,Flash中還存放了一些靜態圖片資源,客戶項目有顯示屏,Flash里放一些固定圖片數據方便UI切換。

  介紹完客戶的項目設計,現在描述客戶的軟複位無法重新啟動問題。其實這個問題現象很簡單,就是每次重新上電啟動,程式都是可以正常運行的,但是一旦使用按鍵軟複位(ONOFF Reset),系統就會有一定概率起不來(概率很大,很容易復現),調試器連上去會發現PC停留在BootROM里,這意味著此時BootROM沒能正常啟動L2 loader。

二、問題分析

  讓我們來分析一下問題,這個問題要從兩方面來考慮:一、板子上晶元的POR和軟複位的區別;二、軟複位無法啟動是概率性的,因此痞子衡想到瞭如下四處疑點:

  1. 兩種複位下主晶元內部非易失寄存器狀態的區別是否對BootROM運行產生了影響?
  2. 兩種複位下主晶元內FlexSPI這個模塊狀態是否有區別?
  3. 兩種複位下外掛Flash晶元狀態是否有區別?
  4. 客戶App代碼里是否有某種操作導致了概率性問題的發生?

  因為每次都是軟複位重新啟動出問題,所以客戶板級供電設計不在疑點範圍內。雖然問題都表現在BootROM沒法載入L2 loader執行,但BootROM本身缺陷也不是我們主要考慮的方向,畢竟BootROM是固化在晶元內部的,可靠性有一定保證。我們首先要把疑點放在概率性以及兩種複位的差異上,那麼我們從哪裡開始著手測試?

  痞子衡想的是先從第4個疑點開始下手,原因是前3個疑點本質上都由第4個疑點引起的,客戶代碼的執行可能會改主晶元內部非易失性寄存器,也同時會操作FlexSPI模塊去訪問外部Flash,它是問題的引爆點。

三、開始測試

3.1 對比非易失性寄存器

  i.MXRT內部有一些非易失性寄存器(比如IOMUXC_GPR寄存器組,SRC寄存器等),這些寄存器僅在POR時才會被覆位,而普通軟複位是不會改變其狀態的。客戶App代碼近5MB,如果是去肉眼排查是否操作了非易失性寄存器,難免有疏漏。最簡單的方法就是在正常啟動和非正常啟動時分別用調試器將這些寄存器的值全部保存下來,然後使用文本工具去對比。經測試,兩種情況下,這些非易失性寄存器並無區別,因此這個疑點被排除。

3.2 逐步精簡App代碼

  現在我們開始逐步精簡App代碼,由於客戶代碼涉及機密,所以精簡的工作由客戶來做,當然客戶也最清楚如何去精簡他們自己的代碼。一番測試下來,我們發現App代碼里只要不去讀存在Flash里的靜態圖片數據,就不會存在軟複位無法重新啟動問題,看起來我們已經找到線索了。

四、原因分析

  問題出在App代碼里讀存在Flash里的靜態圖片數據,這意味著App里可能用了特殊的讀Flash方法改變了Flash狀態,並且這個Flash狀態是非易失性的。謎團接近解開了,痞子衡讓客戶公佈了他們的L2 loader里的FDCB配置頭以及App里的讀Flash圖片的代碼實現:

4.1 L2 loader的FDCB

  先來看客戶的FDCB啟動頭,客戶僅讓BootROM配置Flash工作於50MHz,並且是1bit SDR Fast Read(命令是0x0B),這是標準3位元組地址讀,因此配置成功後通過AHB匯流排最大可訪問16MB以內的Flash空間。因為客戶的L2 loader很小,且存儲在Flash的起始地址,所以這樣的配置對於啟動而言沒有問題。

4.2 App讀Flash實現

  再來看客戶實現的讀Flash函數BigCapRead(),根據前面的介紹,靜態圖片數據是從0x60800000處開始存儲的,因此0x60800000 - 0x60FFFFFF範圍內的8MB數據是可以直接AHB讀,但是0x61000000地址之後的數據在上述BootROM的配置下無法直接訪問,這也是為什麼客戶寫了BigCapRead()函數,這個函數會根據傳入的地址範圍來判斷數據是在低16MB空間還是高16MB空間,然後對地址空間做了一個切換。

#define FLASH_BIG_CAP_SIZE (0x1000000)

static status_t flexspi_nor_select_segment(uint32_t base, uint8_t seg)
{
    qspi_transfer_t flashXfer;
    status_t status = Success;
    uint32_t writeValue = 0x00;
    uint32_t readValue = 0x00;

    flexspi_nor_write_enable(base, 0, true);

    flexspi_nor_read_volatilebankaddr_reg(base, &readValue);
    if ((readValue & 0x01) == (seg & 0x1))
    {
        return Success;
    }

    writeValue = seg & 0x1;
    flexspi_nor_write_volatilebankaddr_reg(base, writeValue);

    flexspi_nor_read_volatilebankaddr_reg(base, &readValue);
    if (readValue != writeValue)
    {
        return Failure;
    }

    flexspi_nor_wait_bus_busy(base);
    return Success;
}

static UINT32 BigCapRead(struct flash_dev* dev, UINT32 start_addr, UCHAR *buffer, UINT32 size)
{
    UINT32 tempLen = 0;
    UINT32 result = 0;
    if (start_addr >= FLASH_BIG_CAP_SIZE)
    {
        flexspi_nor_select_segment(dev->base, 1);
        start_addr = start_addr - FLASH_BIG_CAP_SIZE;
        result = Read(dev, start_addr, buffer, size);
    }
    else
    {
        if (start_addr + size < FLASH_BIG_CAP_SIZE)
        {
            flexspi_nor_select_segment(dev->base, 0);
            result = Read(dev, start_addr, buffer, size);
        }
        else
        {
            tempLen = FLASH_BIG_CAP_SIZE - start_addr;
            flexspi_nor_select_segment(dev->base, 0);
            result = Read(dev, start_addr, buffer, tempLen);
            flexspi_nor_select_segment(dev->base, 1);
            result = Read(dev, 0, buffer + tempLen, size - tempLen);
        }
    }
    return result;
}

4.3 關於Flash的3/4位元組地址

  對於16MB以上空間的Flash,總會面臨3/4位元組地址訪問的問題,JESD216規定了3/4位元組地址訪問標準命令,對於3位元組地址Fast Read,其命令是FRD(0x0B);而對於四位元組地址Fast Read,其命令是4FRD(0x0C)。對於一個32MB的Flash,如果僅需要訪問低16MB空間,可以使用FRD;如果需要訪問高16MB空間,則需要使用4FRD。

  4FRD相比FRD多傳輸了一位元組地址,對於地址連續的大塊數據訪問,這個1位元組地址影響不太,但是如果是執行代碼或者非連續數據訪問,4FRD相比FRD還是有效率上的降低的,對於這個問題,不同的廠家提供了不同的解決方案。

  客戶選用的這款Flash來自ISSI,ISSI的解決方案是在Flash內部增加一個Bank Address Register,其bit0用於實時切換低Bank和高Bank(並且這個位是非易失性的,僅POR才會複位,引腳reset無法複位!),當bit0值為0時,FRD命令訪問的是低16MB空間,而bit0置1後,FRD命令此時實際訪問的是高16MB空間(從AHB地址上看不出這個變化)。

4.4 解決方案

  看到這,這個軟複位無法重啟問題真相大白了,是由於這顆Flash里的內部非易失寄存器BAR[0]的操作導致的,如果軟複位時間點恰好在App讀了高16MB空間(Bank1)里的數據之後,此時Bank發生了切換,軟複位後BootROM去啟動時無法讀到存在低16MB空間(Bank0)的有效的L2 loader。如果軟複位時間點發生在App正在讀低16MB空間的數據,那下次還是可以正常啟動,這就是概率性啟動失敗的原因。

  原因調查清楚了,問題解決方法就很簡單了,將L2 loader里的FDCB頭用4FRD代替FRD,這樣BootROM配置完成之後,可以直接AHB讀全部的32MB空間,不需要切換Bank,因此App里的BigCapRead()函數里的Bank切換操作可以刪掉。

  這個經驗也告訴了我們,當使用16MB以上Flash作為啟動設備時,一定要小心處理好3/4位元組地址訪問問題,不然就可能出現啟動問題。

  至此,i.MXRT上使用16MB以上NOR Flash軟複位無法正常啟動問題的分析解決經驗痞子衡便介紹完畢了,掌聲在哪裡~~~

歡迎訂閱

文章會同時發佈到我的 博客園主頁CSDN主頁知乎主頁微信公眾號 平臺上。

微信搜索"痞子衡嵌入式"或者掃描下麵二維碼,就可以在手機上第一時間看了哦。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • BitMap的基本思想就是用一個bit位來標記某個元素對應的Value,而Key即是該元素。由於採用了Bit為單位來存儲數據,因此可以大大節省存儲空間。 BitMap可以看成一種數據結構。 ...
  • 寫在前面 現在部署Asp.Net Core應用已經不再限制於Windows的IIS上,更多的是Docker容器、各種反向代理來部署。也有少部分用IIS部署的,IIS部署確實是又快又簡單,圖形化操作三下五除二就可以發佈好一個系統了。在過去Asp.Net MVC 項目部署的時候,還常常使用IIS一個功能 ...
  • identityserver4 的版本前段時間更新到V4,和之前的版本,還是有一些使用的差異; 1. API資源聲明,之前版本用的是ApiResource,新版本用的是ApiScope,從名字就可以看出區別,新版是用 Scope 區分的; /// <summary> /// 新版本 /// </su ...
  • Session中文是“會話”的意思,在ASP.NET中代表了伺服器與客戶端之間的“會話”。Session的作用時間從用戶到達某個特定的Web頁開始,到該用戶離開Web站點,或在程式中利用代碼終止某個Session結束。引用Session 則可以讓一個用戶訪問多個頁面之間的切換也會保留該用戶的信息。 ...
  • Ajax 是一種在無需重新載入整個網頁的情況下,能夠更新部分網頁的技術。 通過在後臺與伺服器進行少量數據交換,Ajax 可以使網頁實現非同步更新。 這意味著可以在不重新載入整個網頁的情況下,對網頁的某部分進行更新. 傳統的網頁(不使用 Ajax)如果需要更新內容,必須重載整個網頁頁面。 ...
  • 模態對話框是指用戶只能和當前對話框進行交互的視窗,常見的比如消息對話框,用戶等待視窗這種,當然這不是固定使用。Windows Form中已經提供了通過視窗的ShowDialog()方法實現模態對話框。只是界面效果有些單一,所以本篇只是為模態對話框增添些界面效果的優化。 在網上看到有很多人用重繪OnP ...
  • 一直不怎麼喜歡IIS,就一個簡單的服務,要安裝IIS,然後各種配置,雖然可以用程式一鍵搭建IIS環境和啟動服務,但是也麻煩的很。 之前接觸過一段Java,覺得Tomcat挺方便,一拷貝點擊運行就Ok。後來看到官網 WebAPI2使用OWIN自托管控制台啟動, 測試一下挺正常的,項目也採用這種方式部署 ...
  • 目錄 一、目的 二、準備 2.1 硬體 2.2 軟體 2.3 網路 結果 三、過程 3.1 鏡像製作 1.選擇鏡像 2. 製作啟動盤 3.2 安裝系統 1. 換源 2. 配置SSH 3. 設置靜態IP 4. 宿主機配置 5. 查看網卡 6. 修改配置文件 6.1 修改 6.2 新增 7. 重啟網路 ...
一周排行
    -Advertisement-
    Play Games
  • 隨著Aspire發佈preview5的發佈,Microsoft.Extensions.ServiceDiscovery隨之更新, 服務註冊發現這個屬於老掉牙的話題解決什麼問題就不贅述了,這裡主要講講Microsoft.Extensions.ServiceDiscovery(preview5)以及如何 ...
  • 概述:通過使用`SemaphoreSlim`,可以簡單而有效地限制非同步HTTP請求的併發量,確保在任何給定時間內不超過20個網頁同時下載。`ParallelOptions`不適用於非同步操作,但可考慮使用`Parallel.ForEach`,儘管在非同步場景中謹慎使用。 對於併發非同步 I/O 操作的數量 ...
  • 1.Linux上安裝Docken 伺服器系統版本以及內核版本:cat /etc/redhat-release 查看伺服器內核版本:uname -r 安裝依賴包:yum install -y yum-utils device-mapper-persistent-data lvm2 設置阿裡雲鏡像源:y ...
  • 概述:WPF界面綁定和渲染大量數據可能導致性能問題。通過啟用UI虛擬化、非同步載入和數據分頁,可以有效提高界面響應性能。以下是簡單示例演示這些優化方法。 在WPF中,當你嘗試綁定和渲染大量的數據項時,性能問題可能出現。以下是一些可能導致性能慢的原因以及優化方法: UI 虛擬化: WPF提供了虛擬化技術 ...
  • 引言 上一章節介紹了 TDD 的三大法則,今天我們講一下在單元測試中模擬對象的使用。 Fake Fake - Fake 是一個通用術語,可用於描述 stub或 mock 對象。 它是 stub 還是 mock 取決於使用它的上下文。 也就是說,Fake 可以是 stub 或 mock Mock - ...
  • 為.net6在CentOS7上面做準備,先在vmware虛擬機安裝CentOS 7.9 新建CentOS764位的系統 因為CentOS8不更新了,所以安裝7;簡單就一筆帶過了 選擇下載好的操作系統的iso文件,下載地址https://mirrors.aliyun.com/centos/7.9.20 ...
  • 經過前面幾篇的學習,我們瞭解到指令的大概分類,如:參數載入指令,該載入指令以 Ld 開頭,將參數載入到棧中,以便於後續執行操作命令。參數存儲指令,其指令以 St 開頭,將棧中的數據,存儲到指定的變數中,以方便後續使用。創建實例指令,其指令以 New 開頭,用於在運行時動態生成並初始化對象。方法調用指... ...
  • LiteDB 是一個輕量級的嵌入式 NoSQL 資料庫,其設計理念與 MongoDB 類似,但它是完全使用 C# 開發的,因此與 C# 應用程式的集成非常順暢。與 SQLite 相比,LiteDB 提供了 NoSQL(即鍵值對)的數據存儲方式,並且是一個開源且免費的項目。它適用於桌面、移動以及 We ...
  • 1 開源解析和拆分文檔 第三方的工具去對文件解析拆分,去將我們的文件內容給提取出來,並將我們的文檔內容去拆分成一個小的chunk。常見的PDF word mark down, JSON、HTML。都可以有很好的一些模塊去把這些文件去進行一個東西去提取。 優勢 支持豐富的文檔類型 每種文檔多樣化選擇 ...
  • OOM是什麼?英文全稱為 OutOfMemoryError(記憶體溢出錯誤)。當程式發生OOM時,如何去定位導致異常的代碼還是挺麻煩的。 要檢查OOM發生的原因,首先需要瞭解各種OOM情況下會報的異常信息。這樣能縮小排查範圍,再結合異常堆棧、heapDump文件、JVM分析工具和業務代碼來判斷具體是哪 ...