在嵌入式軟體開發過程中,花在測試和花在編碼的時間比通常在3:1左右(實際上可能更多)。這個比例會隨著工程師編程、測試水平的提高而不斷下降,但無論如何,軟體測試都是嵌入式軟體開發中至關重要的部分。 多年前,一位工程師為了對嵌入式擁有更深層次理解的追求,曾發出這樣的疑問:“我怎麼才能知道並懂得我的系統到 ...
在嵌入式軟體開發過程中,花在測試和花在編碼的時間比通常在3:1左右(實際上可能更多)。這個比例會隨著工程師編程、測試水平的提高而不斷下降,但無論如何,軟體測試都是嵌入式軟體開發中至關重要的部分。
多年前,一位工程師為了對嵌入式擁有更深層次理解的追求,曾發出這樣的疑問:“我怎麼才能知道並懂得我的系統到底在幹些什麼呢?”。同時代的嵌入式開發人員問得最多的問題大都圍繞“我怎麼才能使程式跑得更快”、“什麼編譯器最好”,這個問題雖然不同尋常,但卻異乎成熟。今天就讓我們一起瞭解10條在業界廣為流傳的嵌入式開發測試秘訣。
1.懂得使用工具
嵌入式系統通常對可靠性要求較高,一旦發生安全問題可能就會導致災難性的後果,即使與安全無關也會帶來嚴重的經濟損失,對嵌入式系統及軟體有著嚴格的測試、確認和驗證要求。隨著越來越多的領域的嵌入式設備開始被軟體和微處理器控制,對日益複雜的嵌入式軟體進行快速有效的測試顯得愈加重要。
好的修車匠需要好工具,好的程式員應該能夠熟練運用各種軟體工具。不同的工具有不同的使用範圍、功能。合適的工具可以讓工程師看到系統在幹些什麼,它又占用什麼資源、到底和外界哪些東西打交道。工程師不應該害怕加入測試工具或測試模塊到代碼需要的技巧或可能引入新的錯誤,光靠不斷修改、重新編譯代碼來消除Bug是不夠的;也不應該因習慣使用printf之類的簡單測試手段而不進行新的學習和探索。下麵是一些嵌入式常用的測試工具。
源碼級調試器【Source-levelDebugger】:此類調試器一般提供單步或多步調試、斷點設置、記憶體檢測、變數查看等功能,是嵌入式調試最基本的調試方法。
簡單實用的列印顯示工具【printf】:printf及類似的列印顯示工具估計是最靈活、最簡單的調試工具。列印代碼執行過程中的各種變數可以讓工程師獲知代碼執行的情況,但printf對正常的代碼執行干擾比較大(一般printf會占用CPU較長時間),需要慎重使用,最好設置列印開關來控制列印。
ICE或JTAG調試器【In- circuitEmulator】:ICE是用來模擬CPU核心的設備,可以在不幹擾運算器的正常運行情況下,實時檢測CPU內部工作情況,也能像桌面調試軟體一樣提供複雜的條件斷點、先進的實時跟蹤、性能分析和埠分析等功能。ICE一般都有一個較為特殊的CPU,被稱為外合(bond-out)CPU,是一種被打開了封裝且通過特殊的連接可以訪問CPU內部信號的CPU,這些信號在CPU被封裝時是沒法被“看到”的。當和工作站上強大的調試軟體聯合使用時,ICE就能提供幾乎最全面的調試功能。然而ICE同樣有著昂貴、不能全速工作的缺點;同樣,並不是所有的CPU都可以作為外合CPU的,從另一個角度說,這些外合CPU也不大可能及時被新出的CPU所更換。JTAG(Joint Test Action Group)最初開發目的是監測IC和電路連接,但其擴展了包括調試支持在內的用途。
ROM監視器【ROMMonitor】:一款駐留在嵌入系統ROM中的小程式,通過串列或網路連接和運行在工作站上的調試軟體通信。這是最低端的技術,相對便宜,除了要求一個通信埠和少量的記憶體空間外,不需要其它任何專門的硬體,提供下載代碼、運行控制、斷點、單步步進,以及觀察、修改寄存器和記憶體等功能。由於ROM監控器是操作軟體的一部分,所以如果想要檢查CPU和應用程式的狀態,必須先停下應用程式,再次進入ROM監控器。
Data監視器【DataMonitor】:在不停止CPU運行的情況下不僅可以顯示指定變數內容,還可以收集並以圖形形式顯示各個變數的變化過程。
OS監視器【Operating System Monitor】:操作系統監視器可以顯示諸如任務切換、信號量收發、中斷等事件。這些監視器能夠呈現事件之間的關係和時間聯繫,還可以提供對信號量優先順序反轉、死鎖和中斷延時等問題的診斷。
性能分析工具【Profiler】:可以用來測試CPU消耗所在,瞭解系統瓶頸、CPU的使用率以及需要優化之處。
記憶體測試工具【MemoryTeseter】:可以找到記憶體使用的問題所在,比如記憶體泄露、記憶體碎片、記憶體崩潰等問題。如果發現系統出現不可預知或間歇性的問題,就應該使用記憶體測試工具進行嘗試。
運行跟蹤器【ExecutionTracer】:可以顯示CPU執行了哪些函數、誰在調用、參數是什麼、何時調用等情況,主要用於測試代碼邏輯,可在大量事件中發現異常。
覆蓋工具【CoverageTester】:主要顯示CPU具體執行了哪些代碼,便於瞭解代碼分支未被執行的區域,有助於提高代碼質量並消除無用代碼。
GUI測試工具【GUITester】:大多嵌入式應用都帶有某種特定形式的圖形用戶交互界面,部分系統的性能測試是根據用戶輸入響應時間來進行的。GUI測試工具可以作為開發環境中運行測試用例的腳本工具,其功能包括對操作的記錄和回放、抓取屏幕顯示供後續分析比較、設置和管理測試過程(Rational公司的robot和Mercury的Loadrunner工具是之中的傑出代表)。沒有GUI的嵌入式設備可通過插裝來運行GUI測試腳本,雖然需要更改被測代碼,但是節省了功能測試和回歸測試的時間。
天目全數字實時模擬軟體【SkyEye】:作為基於可視化建模的硬體行為級模擬平臺,為嵌入式系統提供虛擬化運行環境,支持主流嵌入式硬體平臺,可運行國內外主流的操作系統,對國產生態的支持尤為出色。工程師可基於SkyEye的虛擬硬體快速搭建模型並提前進行開發、測試和驗證工作,實現高效率、高質量的軟體交付。
2.儘早發現記憶體問題
記憶體問題存在較大危害且不容易排查,主要有三種類型:記憶體泄露、記憶體碎片和記憶體崩潰。對待記憶體問題必須要明確早發現、早“治療”的態度。
記憶體泄漏
記憶體泄露是軟體設計最常見的記憶體難題,指由於不斷分配的記憶體無法及時地被釋放,逐漸耗盡系統記憶體。即使細心的編程老手也會遭遇記憶體泄露問題,因其一般隱藏很深,很難通過代碼閱讀發現,甚至可能出現在庫當中——有可能庫中本就有bug,也有可能是因為工程師沒有正確理解介面說明文檔而造成了錯用。
大多數的記憶體泄露雖然無法探測,但會表現為隨機的故障,往往會被認為是硬體問題。如果用戶對系統穩定性要求較高,此類問題會導致客戶對產品失去信心,項目也會因此失敗。考慮到記憶體泄漏的巨大危害,現在已有眾多解決工具,通過查找沒有被引用或重覆使用的代碼塊、垃圾記憶體收集、庫跟蹤等技術來發現記憶體泄露,儘管每款工具都有利有弊,但還是應防患於未然,儘量測試記憶體泄漏。
記憶體碎片
記憶體碎片比記憶體泄露有著更深的隱匿性。隨著記憶體不斷被分配並釋放,大塊記憶體被不斷分解為小塊記憶體,從而形成碎片,後續需要申請大塊記憶體時就有可能會失敗。系統記憶體夠大或許可能可以堅持較長時間,但最終還是逃不出分配失敗的厄運。在使用動態分配的系統中,記憶體碎片經常發生。
該問題當前最為有效的方法便是使用工具,通過顯示系統記憶體使用情況來找到記憶體碎片的罪魁禍首併進行改進。很多公司為避免動態記憶體管理問題,會選擇在嵌入式應用中禁用malloc/free來以絕後患。
記憶體崩潰
記憶體崩潰是記憶體使用最為嚴重的結果,主要造成原因有數組訪問越界、指針計算錯誤、重覆釋放同一段記憶體、釋放非動態記憶體等。此類問題發生通常是隨機的,極難事先排查,目前也很少有可供排查的工具。
綜上,使用記憶體管理單元必須要小心謹慎,嚴格遵守其使用規則。
3.深入理解代碼優化
人們對嵌入式系統的關註點通常在於實時性和速度,這兩個要素直接影響著代碼效率,需要對代碼進行優化。瞭解如何優化代碼是每個嵌入式軟體開發人員必須具備的技能,而優化代碼的前提和必要條件則是找到真正需要優化之處,然後再對症下藥。
上文提到的profile能夠記錄如各任務CPU占用率、優先順序分配、數據拷貝次數、磁碟訪問次數、是否調用網路收發程式、測試代碼是否已經關閉等數據,但在分析實時系統性能方面仍有不足。一方面,profile的使用往往是在系統出現問題,即CPU耗盡之後,而profile本身對CPU占用較大,所以很有可能不起作用。根據Heisenberg效應,任何測試手段或多或少都會改變系統運行。
4.不要大海撈針
大海撈針是對調試的生動比喻。尋找bug時應先確實是否在開發時有過為了尋求捷徑而沒有嚴格遵守編碼設計規範的情況,或是沒有檢測部分假設條件或演算法的正確性、沒有將可能存在問題的代碼打上記號。可參照《高質量c++/c編程指南》或《關於C的0x8本“經書”》來學習。
為了儘可能地暴露和捕捉問題根源,可以設計較為全面的錯誤跟蹤代碼:儘可能處理每一個函數調用失敗,儘可能檢測每個參數輸入輸出的有效性,包括指針及是否過多或過少地調用某個過程。錯誤跟蹤能夠瞭解bug的大概位置。
5.重現並隔離問題
對於模塊獨立的大型項目,如果問題的出現是間歇性的,則有必要設法去重現併進行記錄完整過程,以備在下一次出現問題是進行復用。
確保問題重現後可用隔離的方法來解決問題:用#ifdef把一些可能和問題無關的代碼關閉,把系統最小化到仍能夠重現問題的地步。如果還是無法定位問題所在,可以考慮打開“工具箱”:試著用ICE或數據監視器去查看某個可疑變數的變化;使用跟蹤工具獲得函數調用的情況(包括參數的傳遞);檢查記憶體是否崩潰以及堆棧溢出的問題。
6.以退為進
獵人為了不使自己在森林里迷路常常會在樹木上留下標記,對過去代碼修改進行跟蹤記錄對將來出現問題之後的調試也很有幫助。代碼控制系統SCS或代碼控制系統SCS可以很好地解決修改回溯問題,將上個版本checkin下來後和當前測試版本比較,可採用SCS/VCS/CVS自帶的diff工具或其他功能更強的比較工具,比如BeyondCompare和ExamDiff。通過比較、分析所有改動代碼,可以得到所有可能導致問題的可疑代碼的分析結果。
7.確定測試的完整性
覆蓋率測試可供確認CPU到底執行了哪些代碼,從而確認測試的完整性。覆蓋率工具有不同的測試級別,用戶可以根據自己的需要選擇某個級別。
即使單元測試已經很全面且沒有deadcode,覆蓋率工具還是可以指出一些潛在問題。
以下方代碼為例:
if(i>=0&& (almostAlwaysZero==0||(last=i)))
如果almostAlwaysZero為非0,那麼last=i賦值語句就被跳過,無法完成目標。
此類問題可輕鬆通過覆蓋率工具的條件測試功能完成解決,覆蓋率測試工具對提高代碼質量是很有幫助的。
8.提高代碼質量意味著節省時間
有研究表明,超過80%的軟體開發時間被用在下麵幾個方面:調試自己的代碼(單元測試)、調試自己和其他相關的代碼(模塊間測試)、調試整個系統(系統測試),更糟糕的則是可能需要花費10-200倍的時間來找一個最開始時很容易就能發現的bug。
千里之堤毀於蟻穴,即使bug對整個系統的性能沒有太大的影響,但仍然很可能會影響可以被看得到的部分,必須養成良好的編碼習慣和測試手段,以求更高的代碼質量,縮短代碼的調試。
9.發現它,分析它,解決它
世界沒有萬能的膏藥,工具再好用也有無法實現之處,對於隱藏很深、用盡所有工具也無法查到其根源的問題,則需要通過問題的外在表現或數據輸出來尋找其中規律,從而找出異常。任何異常的發現都應深入理解並回溯其根源。
10.請利用初學者思維
“有些事情在初學者的腦子裡可能有各種各樣的情況,可在專家的頭腦里可能就很單一”,簡單問題想複雜、簡單系統設計複雜很可能就是由於“專家思維”。被問題難住時,不妨換個思路,或許就能得到意想不到的啟發。
11.測試工具推薦
嵌入式調試無疑是一門藝術,和其它藝術一樣,想要取得成功就必須具備智慧、經驗並懂得使用工具。天目全數字實時模擬軟體SkyEye可供搭建嵌入式系統虛擬化運行環境,工程師可不受物理硬體限制,隨時訪問目標系統,快速搭建虛擬硬體模型並提前進行開發、測試和驗證工作,實現高效率、高質量的軟體交付。
▲Skyeye 覆蓋率測試界面
原文鏈接:https://mp.weixin.qq.com/s/Yk36_435jz--oP4eVntTzA