本文介紹一種Cortex M內核中的精確延時方法 前言 為什麼要學習這種延時的方法? 1. 很多時候我們跑操作系統,就一般會占用一個硬體定時器——SysTick,而我們一般操作系統的時鐘節拍一般是設置100 1000HZ,也就是1ms——10ms產生一次中斷。很多裸機教程使用延時函數又是基於SysT ...
本文介紹一種Cortex-M內核中的精確延時方法
前言
為什麼要學習這種延時的方法?
- 很多時候我們跑操作系統,就一般會占用一個硬體定時器——SysTick,而我們一般操作系統的時鐘節拍一般是設置100-1000HZ,也就是1ms——10ms產生一次中斷。很多裸機教程使用延時函數又是基於SysTick的,這樣一來又難免產生衝突。
- 很多人會說,不是還有定時器嗎,定時器的計時是超級精確的。這點我不否認,但是假設,如果一個系統,總是進入定時器中斷(10us一次/1us一次/0.5us一次),那整個系統就會經常被打斷,線程的進行就沒辦法很好運行啊。此外還消耗一個硬體定時器資源,一個硬體定時器可能做其他事情呢!
- 對應ST HAL庫的修改,其實傑傑個人覺得吧,ST的東西什麼都好,就是出的HAL庫太噁心了,沒辦法,而HAL庫中有一個HAL_Delay(),他也是採用SysTick延時的,在移植操作系統的時候,會有諸多不便,不過好在,HAL_Delay()是一個弱定義的,我們可以重寫這個函數的實現,那麼,採用內核延時當然是最好的辦法啦(個人是這麼覺得的)當然你有能力完全用for迴圈寫個簡單的延時還是可以的。
可能我說的話沒啥權威,那我就引用Cortex-M3權威指南中的一句話——“DWT 中有剩餘的計數器,它們典型地用於程式代碼的“性能速寫”(profiling)。通過編程它們,就可以讓它們在計數器溢出時發出事件(以跟蹤數據包的形式)。最典型地,就是使用 CYCCNT寄存器來測量執行某個任務所花的周期數,這也可以用作時間基準相關的目的(操作系統中統計 CPU使用率可以用到它)。”
Cortex-M中的DWT
在Cortex-M裡面有一個外設叫DWT(Data Watchpoint and Trace),是用於系統調試及跟蹤,
它有一個32位的寄存器叫CYCCNT,它是一個向上的計數器,記錄的是內核時鐘運行的個數,內核時鐘跳動一次,該計數器就加1,精度非常高,決定內核的頻率是多少,如果是F103系列,內核時鐘是72M,那精度就是1/72M = 14ns,而程式的運行時間都是微秒級別的,所以14ns的精度是遠遠夠的。最長能記錄的時間為:60s=2的32次方/72000000(假設內核頻率為72M,內核跳一次的時間大概為1/72M=14ns),而如果是H7這種400M主頻的晶元,那它的計時精度高達2.5ns(1/400000000 = 2.5),而如果是 i.MX RT1052這種比較牛逼的處理器,最長能記錄的時間為: 8.13s=2的32次方/528000000 (假設內核頻率為528M,內核跳一次的時間大概為1/528M=1.9ns) 。當CYCCNT溢出之後,會清0重新開始向上計數。
m3、m4、m7傑傑實測可用(m0不可用)。
精度:1/內核頻率(s)。
要實現延時的功能,總共涉及到三個寄存器:DEMCR 、DWT_CTRL、DWT_CYCCNT,分別用於開啟DWT功能、開啟CYCCNT及獲得系統時鐘計數值。
DEMCR
想要使能DWT外設,需要由另外的內核調試寄存器DEMCR的位24控制,寫1使能(劃重點啦,要考試!!)。
DEMCR的地址是0xE000 EDFC
關於DWT_CYCCNT
使能DWT_CYCCNT寄存器之前,先清0。
讓我們看看DWT_CYCCNT的基地址,從ARM-Cortex-M手冊中可以看到其基地址是0xE000 1004,複位預設值是0,而且它的類型是可讀可寫的,我們往0xE000 1004這個地址寫0就將DWT_CYCCNT清0了。
關於CYCCNTENA
CYCCNTENA Enable the CYCCNT counter. If not enabled, the counter does not count and no event is
generated for PS sampling or CYCCNTENA. In normal use, the debugger must initialize
the CYCCNT counter to 0.
它是DWT控制寄存器的第一位,寫1使能,則啟用CYCCNT計數器,否則CYCCNT計數器將不會工作。
綜上所述
想要使用DWT的CYCCNT步驟:
- 先使能DWT外設,這個由另外內核調試寄存器DEMCR的位24控制,寫1使能
- 使能CYCCNT寄存器之前,先清0。
- 使能CYCCNT寄存器,這個由DWT的CYCCNTENA 控制,也就是DWT控制寄存器的位0控制,寫1使能
代碼實現
/**
******************************************************************
* @file core_delay.c
* @author fire
* @version V1.0
* @date 2018-xx-xx
* @brief 使用內核寄存器精確延時
******************************************************************
* @attention
*
* 實驗平臺:野火 STM32開發板
* 論壇 :http://www.firebbs.cn
* 淘寶 :https://fire-stm32.taobao.com
*
******************************************************************
*/
#include "./delay/core_delay.h"
/*
**********************************************************************
* 時間戳相關寄存器定義
**********************************************************************
*/
/*
在Cortex-M裡面有一個外設叫DWT(Data Watchpoint and Trace),
該外設有一個32位的寄存器叫CYCCNT,它是一個向上的計數器,
記錄的是內核時鐘運行的個數,最長能記錄的時間為:
10.74s=2的32次方/400000000
(假設內核頻率為400M,內核跳一次的時間大概為1/400M=2.5ns)
當CYCCNT溢出之後,會清0重新開始向上計數。
使能CYCCNT計數的操作步驟:
1、先使能DWT外設,這個由另外內核調試寄存器DEMCR的位24控制,寫1使能
2、使能CYCCNT寄存器之前,先清0
3、使能CYCCNT寄存器,這個由DWT_CTRL(代碼上巨集定義為DWT_CR)的位0控制,寫1使能
*/
#define DWT_CR *(__IO uint32_t *)0xE0001000
#define DWT_CYCCNT *(__IO uint32_t *)0xE0001004
#define DEM_CR *(__IO uint32_t *)0xE000EDFC
#define DEM_CR_TRCENA (1 << 24)
#define DWT_CR_CYCCNTENA (1 << 0)
/**
* @brief 初始化時間戳
* @param 無
* @retval 無
* @note 使用延時函數前,必須調用本函數
*/
HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority)
{
/* 使能DWT外設 */
DEM_CR |= (uint32_t)DEM_CR_TRCENA;
/* DWT CYCCNT寄存器計數清0 */
DWT_CYCCNT = (uint32_t)0u;
/* 使能Cortex-M DWT CYCCNT寄存器 */
DWT_CR |= (uint32_t)DWT_CR_CYCCNTENA;
return HAL_OK;
}
/**
* @brief 讀取當前時間戳
* @param 無
* @retval 當前時間戳,即DWT_CYCCNT寄存器的值
*/
uint32_t CPU_TS_TmrRd(void)
{
return ((uint32_t)DWT_CYCCNT);
}
/**
* @brief 讀取當前時間戳
* @param 無
* @retval 當前時間戳,即DWT_CYCCNT寄存器的值
*/
uint32_t HAL_GetTick(void)
{
return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);
}
/**
* @brief 採用CPU的內部計數實現精確延時,32位計數器
* @param us : 延遲長度,單位1 us
* @retval 無
* @note 使用本函數前必須先調用CPU_TS_TmrInit函數使能計數器,
或使能巨集CPU_TS_INIT_IN_DELAY_FUNCTION
最大延時值為8秒,即8*1000*1000
*/
void CPU_TS_Tmr_Delay_US(uint32_t us)
{
uint32_t ticks;
uint32_t told,tnow,tcnt=0;
/* 在函數內部初始化時間戳寄存器, */
#if (CPU_TS_INIT_IN_DELAY_FUNCTION)
/* 初始化時間戳並清零 */
HAL_InitTick(5);
#endif
ticks = us * (GET_CPU_ClkFreq() / 1000000); /* 需要的節拍數 */
tcnt = 0;
told = (uint32_t)CPU_TS_TmrRd(); /* 剛進入時的計數器值 */
while(1)
{
tnow = (uint32_t)CPU_TS_TmrRd();
if(tnow != told)
{
/* 32位計數器是遞增計數器 */
if(tnow > told)
{
tcnt += tnow - told;
}
/* 重新裝載 */
else
{
tcnt += UINT32_MAX - told + tnow;
}
told = tnow;
/*時間超過/等於要延遲的時間,則退出 */
if(tcnt >= ticks)break;
}
}
}
/*********************************************END OF FILE**********************/
#ifndef __CORE_DELAY_H
#define __CORE_DELAY_H
#include "stm32h7xx.h"
/* 獲取內核時鐘頻率 */
#define GET_CPU_ClkFreq() HAL_RCC_GetSysClockFreq()
#define SysClockFreq (218000000)
/* 為方便使用,在延時函數內部調用CPU_TS_TmrInit函數初始化時間戳寄存器,
這樣每次調用函數都會初始化一遍。
把本巨集值設置為0,然後在main函數剛運行時調用CPU_TS_TmrInit可避免每次都初始化 */
#define CPU_TS_INIT_IN_DELAY_FUNCTION 0
/*******************************************************************************
* 函數聲明
******************************************************************************/
uint32_t CPU_TS_TmrRd(void);
HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority);
//使用以下函數前必須先調用CPU_TS_TmrInit函數使能計數器,或使能巨集CPU_TS_INIT_IN_DELAY_FUNCTION
//最大延時值為8秒
void CPU_TS_Tmr_Delay_US(uint32_t us);
#define HAL_Delay(ms) CPU_TS_Tmr_Delay_US(ms*1000)
#define CPU_TS_Tmr_Delay_S(s) CPU_TS_Tmr_Delay_MS(s*1000)
#endif /* __CORE_DELAY_H */
註意事項:
使用者如果不是在HAL庫中使用,註釋掉:
uint32_t HAL_GetTick(void)
{
return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);
}
同時建議重新命名HAL_InitTick()
函數。
按照自己的平臺重寫以下巨集定義:
/* 獲取內核時鐘頻率 */
#define GET_CPU_ClkFreq() HAL_RCC_GetSysClockFreq()
#define SysClockFreq (218000000)
後記
其實在ucos-iii 源碼中,有一個功能是測量關中斷時間的功能,就是使用STM32的時間戳,即記錄程式運行的某個時刻,如果記錄下程式前後的兩個時刻點,即可以算出這段程式的運行時間。
但是有關內核寄存器的描述的資料非常少,還好找到一個(arm手冊),裡面有這些內核寄存器的詳細描述,其中時間戳相關的寄存器在第10章和11章有詳細的描述。關於資料想看的可以後臺找我拿。
喜歡就關註我吧!
相關代碼可以在公眾號後臺回覆 “ DWT ”獲取。
更多資料歡迎關註“物聯網IoT開發”公眾號!