【原創】Linux中斷子系統(一)-中斷控制器及驅動分析

来源:https://www.cnblogs.com/LoyenWang/archive/2020/05/31/12996812.html
-Advertisement-
Play Games

背景 Read the fucking source code! --By 魯迅 A picture is worth a thousand words. --By 高爾基 說明: Kernel版本:4.14 ARM64處理器,Contex-A53,雙核 使用工具:Source Insight 3. ...


背景

  • Read the fucking source code! --By 魯迅
  • A picture is worth a thousand words. --By 高爾基

說明:

  1. Kernel版本:4.14
  2. ARM64處理器,Contex-A53,雙核
  3. 使用工具:Source Insight 3.5, Visio

1. 概述

從這篇文章開始,來聊一聊中斷子系統。
中斷是處理器用於非同步處理外圍設備請求的一種機制,可以說中斷處理是操作系統管理外圍設備的基石,此外系統調度、核間交互等都離不開中斷,它的重要性不言而喻。

來一張概要的分層圖:

  • 硬體層:最下層為硬體連接層,對應的是具體的外設與SoC的物理連接,中斷信號是從外設到中斷控制器,由中斷控制器統一管理,再路由到處理器上;
  • 硬體相關層:這個層包括兩部分代碼,一部分是架構相關的,比如ARM64處理器處理中斷相關,另一部分是中斷控制器的驅動代碼;
  • 通用層:這部分也可以認為是框架層,是硬體無關層,這部分代碼在所有硬體平臺上是通用的;
  • 用戶層:這部分也就是中斷的使用者了,主要是各類設備驅動,通過中斷相關介面來進行申請和註冊,最終在外設觸發中斷時,進行相應的回調處理;

中斷子系統系列文章,會包括硬體相關、中斷框架層、上半部與下半部、Softirq、Workqueue等機制的介紹,本文會先介紹硬體相關的原理及驅動,前戲結束,直奔主題。

2. GIC硬體原理

  • ARM公司提供了一個通用的中斷控制器GIC(Generic Interrupt Controller)GIC的版本包括V1 ~ V4,由於本人使用的SoC中的中斷控制器是V2版本,本文將圍繞GIC-V2來展開介紹;

來一張功能版的框圖:

  • GIC-V2從功能上說,除了常用的中斷使能、中斷屏蔽、優先順序管理等功能外,還支持安全擴展、虛擬化等;
  • GIC-V2從組成上說,主要分為DistributorCPU Interface兩個模塊,Distributor主要負責中斷源的管理,包括優先順序的處理,屏蔽、搶占等,並將最高優先順序的中斷分發給CPU InterfaceCPU Interface主要用於連接處理器,與處理器進行交互;
  • Virtual DistributorVirtual CPU Interface都與虛擬化相關,本文不深入分析;

再來一張細節圖看看DistributorCPU Interface的功能:

  • GIC-V2支持三種類型的中斷:

    1. SGI(software-generated interrupts):軟體產生的中斷,主要用於核間交互,內核中的IPI:inter-processor interrupts就是基於SGI,中斷號ID0 - ID15用於SGI
    2. PPI(Private Peripheral Interrupt):私有外設中斷,每個CPU都有自己的私有中斷,典型的應用有local timer,中斷號ID16 - ID31用於PPI
    3. SPI(Shared Peripheral Interrupt):共用外設中斷,中斷產生後,可以分發到某一個CPU上,中斷號ID32 - ID1019用於SPIID1020 - ID1023保留用於特殊用途;
  • Distributor功能:

    1. 全局開關控制Distributor分發到CPU Interface
    2. 打開或關閉每個中斷;
    3. 設置每個中斷的優先順序;
    4. 設置每個中斷將路由的CPU列表;
    5. 設置每個外設中斷的觸發方式:電平觸發、邊緣觸發;
    6. 設置每個中斷的Group:Group0或Group1,其中Group0用於安全中斷,支持FIQ和IRQ,Group1用於非安全中斷,只支持IRQ;
    7. SGI中斷分發到目標CPU上;
    8. 每個中斷的狀態可見;
    9. 提供軟體機制來設置和清除外設中斷的pending狀態;
  • CPU Interface功能:

    1. 使能中斷請求信號到CPU上;
    2. 中斷的確認;
    3. 標識中斷處理的完成;
    4. 為處理器設置中斷優先順序掩碼;
    5. 設置處理器的中斷搶占策略;
    6. 確定處理器的最高優先順序pending中斷;

中斷處理的狀態機如下圖:

  • Inactive:無中斷狀態;
  • Pending:硬體或軟體觸發了中斷,但尚未傳遞到目標CPU,在電平觸發模式下,產生中斷的同時保持pending狀態;
  • Active:發生了中斷並將其傳遞給目標CPU,並且目標CPU可以處理該中斷;
  • Active and pending:發生了中斷並將其傳遞給目標CPU,同時發生了相同的中斷並且該中斷正在等待處理;

GIC檢測中斷流程如下:

  1. GIC捕獲中斷信號,中斷信號assert,標記為pending狀態;
  2. Distributor確定好目標CPU後,將中斷信號發送到目標CPU上,同時,對於每個CPU,Distributor會從pending信號中選擇最高優先順序中斷發送至CPU Interface
  3. CPU Interface來決定是否將中斷信號發送至目標CPU;
  4. CPU完成中斷處理後,發送一個完成信號EOI(End of Interrupt)給GIC;

3. GIC驅動分析

3.1 設備信息添加

ARM平臺的設備信息,都是通過Device Tree設備樹來添加,設備樹信息放置在arch/arm64/boot/dts/

下圖就是一個中斷控制器的設備樹信息:

  • compatible欄位:用於與具體的驅動來進行匹配,比如圖片中arm, gic-400,可以根據這個名字去匹配對應的驅動程式;
  • interrupt-cells欄位:用於指定編碼一個中斷源所需要的單元個數,這個值為3。比如在外設在設備樹中添加中斷信號時,通常能看到類似interrupts = <0 23 4>;的信息,第一個單元0,表示的是中斷類型(1:PPI,0:SPI),第二個單元23表示的是中斷號,第三個單元4表示的是中斷觸發的類型;
  • reg欄位:描述中斷控制器的地址信息以及地址範圍,比如圖片中分別制定了GIC Distributor(GICD)GIC CPU Interface(GICC)的地址信息;
  • interrupt-controller欄位:表示該設備是一個中斷控制器,外設可以連接在該中斷控制器上;
  • 關於設備數的各個欄位含義,詳細可以參考Documentation/devicetree/bindings下的對應信息;

設備樹的信息,是怎麼添加到系統中的呢?Device Tree最終會編譯成dtb文件,並通過Uboot傳遞給內核,在內核啟動後會將dtb文件解析成device_node結構。關於設備樹的相關知識,本文先不展開,後續再找機會補充。來一張圖,先簡要介紹下關鍵路徑:

  • 設備樹的節點信息,最終會變成device_node結構,在記憶體中維持一個樹狀結構;
  • 設備與驅動,會根據compatible欄位進行匹配;

3.2 驅動流程分析

GIC驅動的執行流程如下圖所示:

  • 首先需要瞭解一下鏈接腳本vmlinux.lds,腳本中定義了一個__irqchip_of_table段,該段用於存放中斷控制器信息,用於最終來匹配設備;
  • 在GIC驅動程式中,使用IRQCHIP_DECLARE巨集來聲明結構信息,包括compatible欄位和回調函數,該巨集會將這個結構放置到__irqchip_of_table欄位中;
  • 在內核啟動初始化中斷的函數中,of_irq_init函數會去查找設備節點信息,該函數的傳入參數就是__irqchip_of_table段,由於IRQCHIP_DECLARE已經將信息填充好了,of_irq_init函數會根據arm,gic-400去查找對應的設備節點,並獲取設備的信息。中斷控制器也存在級聯的情況,of_irq_init函數中也處理了這種情況;
  • or_irq_init函數中,最終會回調IRQCHIP_DECLARE聲明的回調函數,也就是gic_of_init,而這個函數就是GIC驅動的初始化入口函數了;
  • GIC的工作,本質上是由中斷信號來驅動,因此驅動本身的工作就是完成各類信息的初始化,註冊好相應的回調函數,以便能在信號到來之時去執行;
  • set_smp_process_call設置__smp_cross_call函數指向gic_raise_softirq,本質上就是通過軟體來觸發GIC的SGI中斷,用於核間交互;
  • cpuhp_setup_state_nocalls函數,設置好CPU進行熱插拔時GIC的回調函數,以便在CPU熱插拔時做相應處理;
  • set_handle_irq函數的設置很關鍵,它將全局函數指針handle_arch_irq指向了gic_handle_irq,而處理器在進入中斷異常時,會跳轉到handle_arch_irq執行,所以,可以認為它就是中斷處理的入口函數了;
  • 驅動中完成了各類函數的註冊,此外還完成了irq_chip, irq_domain等結構體的初始化,這些結構在下文會進一步分析;
  • 最後,完成GIC硬體模塊的初始化設置,以及電源管理相關的註冊等工作;

3.3 數據結構分析

先來張圖:

  • GIC驅動中,使用struct gic_chip_data結構體來描述GIC控制器的信息,整個驅動都是圍繞著該結構體的初始化,驅動中將函數指針都初始化好,實際的工作是由中斷信號觸發,也就是在中斷來臨的時候去進行回調;
  • struct irq_chip結構,描述的是中斷控制器的底層操作函數集,這些函數集最終完成對控制器硬體的操作;
  • struct irq_domain結構,用於硬體中斷號和Linux IRQ中斷號(virq,虛擬中斷號)之間的映射;

還是上一下具體的數據結構代碼吧,關鍵註釋如下:

struct irq_chip {
	struct device	*parent_device;     //指向父設備
	const char	*name;      //  /proc/interrupts中顯示的名字
	unsigned int	(*irq_startup)(struct irq_data *data);  //啟動中斷,如果設置成NULL,則預設為enable
	void		(*irq_shutdown)(struct irq_data *data);     //關閉中斷,如果設置成NULL,則預設為disable
	void		(*irq_enable)(struct irq_data *data);   //中斷使能,如果設置成NULL,則預設為chip->unmask
	void		(*irq_disable)(struct irq_data *data);  //中斷禁止

	void		(*irq_ack)(struct irq_data *data);  //開始新的中斷
	void		(*irq_mask)(struct irq_data *data); //中斷源屏蔽
	void		(*irq_mask_ack)(struct irq_data *data); //應答並屏蔽中斷
	void		(*irq_unmask)(struct irq_data *data);   //解除中斷屏蔽
	void		(*irq_eoi)(struct irq_data *data);  //中斷處理結束後調用

	int		(*irq_set_affinity)(struct irq_data *data, const struct cpumask *dest, bool force); //在SMP中設置CPU親和力
	int		(*irq_retrigger)(struct irq_data *data);    //重新發送中斷到CPU
	int		(*irq_set_type)(struct irq_data *data, unsigned int flow_type); //設置中斷觸發類型
	int		(*irq_set_wake)(struct irq_data *data, unsigned int on);    //使能/禁止電源管理中的喚醒功能

	void		(*irq_bus_lock)(struct irq_data *data); //慢速晶元匯流排上的鎖
	void		(*irq_bus_sync_unlock)(struct irq_data *data);  //同步釋放慢速匯流排晶元的鎖

	void		(*irq_cpu_online)(struct irq_data *data);
	void		(*irq_cpu_offline)(struct irq_data *data);

	void		(*irq_suspend)(struct irq_data *data);
	void		(*irq_resume)(struct irq_data *data);
	void		(*irq_pm_shutdown)(struct irq_data *data);

	void		(*irq_calc_mask)(struct irq_data *data);

	void		(*irq_print_chip)(struct irq_data *data, struct seq_file *p);
	int		(*irq_request_resources)(struct irq_data *data);
	void		(*irq_release_resources)(struct irq_data *data);

	void		(*irq_compose_msi_msg)(struct irq_data *data, struct msi_msg *msg);
	void		(*irq_write_msi_msg)(struct irq_data *data, struct msi_msg *msg);

	int		(*irq_get_irqchip_state)(struct irq_data *data, enum irqchip_irq_state which, bool *state);
	int		(*irq_set_irqchip_state)(struct irq_data *data, enum irqchip_irq_state which, bool state);

	int		(*irq_set_vcpu_affinity)(struct irq_data *data, void *vcpu_info);

	void		(*ipi_send_single)(struct irq_data *data, unsigned int cpu);
	void		(*ipi_send_mask)(struct irq_data *data, const struct cpumask *dest);

	unsigned long	flags;
};

struct irq_domain {
	struct list_head link;  //用於添加到全局鏈表irq_domain_list中
	const char *name;   //IRQ domain的名字
	const struct irq_domain_ops *ops;   //IRQ domain映射操作函數集
	void *host_data;    //在GIC驅動中,指向了irq_gic_data
	unsigned int flags; 
	unsigned int mapcount;  //映射中斷的個數

	/* Optional data */
	struct fwnode_handle *fwnode;
	enum irq_domain_bus_token bus_token;
	struct irq_domain_chip_generic *gc;
#ifdef	CONFIG_IRQ_DOMAIN_HIERARCHY
	struct irq_domain *parent;  //支持級聯的話,指向父設備
#endif
#ifdef CONFIG_GENERIC_IRQ_DEBUGFS
	struct dentry		*debugfs_file;
#endif

	/* reverse map data. The linear map gets appended to the irq_domain */
	irq_hw_number_t hwirq_max;  //IRQ domain支持中斷數量的最大值
	unsigned int revmap_direct_max_irq;
	unsigned int revmap_size;   //線性映射的大小
	struct radix_tree_root revmap_tree; //Radix Tree映射的根節點
	unsigned int linear_revmap[];   //線性映射用到的查找表
};

struct irq_domain_ops {
	int (*match)(struct irq_domain *d, struct device_node *node,
		     enum irq_domain_bus_token bus_token);      // 用於中斷控制器設備與IRQ domain的匹配
	int (*select)(struct irq_domain *d, struct irq_fwspec *fwspec,
		      enum irq_domain_bus_token bus_token);
	int (*map)(struct irq_domain *d, unsigned int virq, irq_hw_number_t hw);    //用於硬體中斷號與Linux中斷號的映射
	void (*unmap)(struct irq_domain *d, unsigned int virq);
	int (*xlate)(struct irq_domain *d, struct device_node *node,
		     const u32 *intspec, unsigned int intsize,
		     unsigned long *out_hwirq, unsigned int *out_type);     //通過device_node,解析硬體中斷號和觸發方式

#ifdef	CONFIG_IRQ_DOMAIN_HIERARCHY
	/* extended V2 interfaces to support hierarchy irq_domains */
	int (*alloc)(struct irq_domain *d, unsigned int virq,
		     unsigned int nr_irqs, void *arg);
	void (*free)(struct irq_domain *d, unsigned int virq,
		     unsigned int nr_irqs);
	void (*activate)(struct irq_domain *d, struct irq_data *irq_data);
	void (*deactivate)(struct irq_domain *d, struct irq_data *irq_data);
	int (*translate)(struct irq_domain *d, struct irq_fwspec *fwspec,
			 unsigned long *out_hwirq, unsigned int *out_type);
#endif
};

3.3.1 IRQ domain

IRQ domain用於將硬體的中斷號,轉換成Linux系統中的中斷號(virtual irq, virq),來張圖:

  • 每個中斷控制器都對應一個IRQ Domain;
  • 中斷控制器驅動通過irq_domain_add_*()介面來創建IRQ Domain;
  • IRQ Domain支持三種映射方式:linear map(線性映射),tree map(樹映射),no map(不映射);
    1. linear map:維護固定大小的表,索引是硬體中斷號,如果硬體中斷最大數量固定,並且數值不大,可以選擇線性映射;
    2. tree map:硬體中斷號可能很大,可以選擇樹映射;
    3. no map:硬體中斷號直接就是Linux的中斷號;

三種映射的方式如下圖:

  • 圖中描述了三個中斷控制器,對應到三種不同的映射方式;
  • 各個控制器的硬體中斷號可以一樣,最終在Linux內核中映射的中斷號是唯一的;

4. Arch-speicific代碼分析

  • 中斷也是異常模式的一種,當外設觸發中斷時,處理器會切換到特定的異常模式進行處理,而這部分代碼都是架構相關的;ARM64的代碼位於arch/arm64/kernel/entry.S
  • ARM64處理器有四個異常級別Exception Level:0~3,EL0級對應用戶態程式,EL1級對應操作系統內核態,EL2級對應Hypervisor,EL3級對應Secure Monitor;
  • 異常觸發時,處理器進行切換,並且跳轉到異常向量表開始執行,針對中斷異常,最終會跳轉到irq_handler中;

代碼比較簡單,如下:

/*
 * Interrupt handling.
 */
	.macro	irq_handler
	ldr_l	x1, handle_arch_irq
	mov	x0, sp
	irq_stack_entry
	blr	x1
	irq_stack_exit
	.endm

來張圖:

  • 中斷觸發,處理器去異常向量表找到對應的入口,比如EL0的中斷跳轉到el0_irq處,EL1則跳轉到el1_irq處;
  • 在GIC驅動中,會調用set_handle_irq介面來設置handle_arch_irq的函數指針,讓它指向gic_handle_irq,因此中斷觸發的時候會跳轉到gic_handle_irq處執行;
  • gic_handle_irq函數處理時,分為兩種情況,一種是外設觸發的中斷,硬體中斷號在16 ~ 1020之間,一種是軟體觸發的中斷,用於處理器之間的交互,硬體中斷號在16以內;
  • 外設觸發中斷後,根據irq domain去查找對應的Linux IRQ中斷號,進而得到中斷描述符irq_desc,最終也就能調用到外設的中斷處理函數了;

GIC和Arch相關的介紹就此打住,下一篇文章會接著介紹通用的中斷處理框架,敬請期待。

參考

ARM Generic Interrupt Controller Architecture version 2.0

歡迎關註公眾號,不定期更新Linux內核機制相關文章,謝謝。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 作為公司的公共產品,經常有這樣的需求:就是新建一個本地服務,產品線作為客戶端通過 tcp 接入本地服務,來獲取想要的業務能力。 與印象中動輒處理成千上萬連接的 tcp 網路服務不同,這個本地服務是跑在客戶機器上的,Win32 上作為開機自啟動的 windows 服務運行; Linux 上作為 dae ...
  • dockerfile的格式,dockerfile是一個純文本文件,我們可以理解為構建鏡像的源碼;不同於其他編程語言,dockerfile里沒有if else 沒有迴圈,它裡面僅僅有註釋和構建鏡像的指令;對於dockerfile註釋就是以井號開頭的行為註釋,這個和shell和其他配置文件的語法一樣;... ...
  • 眾所周知,Azure平臺支持Linux。因為我對Linux完全不熟悉,所以最近開始自學Linux。我起初借了一本名聲很響亮的書《鳥哥的Linux私房菜》。讀了幾章後,我覺得這本書寫得的確非常詳細,但是一頁紙上洋洋灑灑寫滿了字,讓人很難有讀下去的欲望,感覺就像在啃一本字典。這本書倒是很適合閑暇時刻翻上 ...
  • 一 Rancher概述1.1 什麼是RancherRancher 是為使用容器的公司打造的容器管理平臺。Rancher 簡化了使用 Kubernetes 的流程,方便開發者可以隨處運行 Kubernetes(Run Kubernetes Everywhere),以便於滿足 IT 需求規範,賦能 De ...
  • NFS 概述 NFS(Network File System)是一種能使伺服器上的信息被其他電腦掛載而達到資源共用的網路文件系統。一個客戶機可以把遠程文件系統掛載到本地文件系統的某個目錄下,作為本地系統的一部分來使用。NFS 有屬於自己的協議和埠號,但在傳送資料或其他相關信息時,NFS 伺服器需 ...
  • 一、Modbus RTU數據幀說明 由發送設備將 Modbus 報文構造為帶有已知起始和結束標記的幀。這使設備可以在報文的開始接收新幀,並且知道何時報文結束。不完整的報文必須能夠被檢測到而錯誤標誌必須作為結果被設置。在 RTU 模式,報文幀由時長至少為 3.5 個字元時間的空閑間隔區分。在後續的部分 ...
  • 這裡說的內部伺服器錯誤是網站前臺能正常訪問,而後臺程式在執行某項任務/功能時所出現的內部伺服器錯誤解決方法; 此錯誤通常是超時導致的,像程式在執行採集、靜態頁面生成時所耗時間太長導致達到超時限制的; 解決方法: 寶塔面板里打開Apache管理→性能調整→連接超時時間設置為120秒以上 最後再重載配置 ...
  • 在 Linux 環境下工作的工程師,一定會對那些繁瑣的指令和參數命令行印象深刻吧。而且,可怕的不是繁瑣,而是需要大量重覆輸入這些繁瑣的命令。 在 Linux 下我們有個別名命令 alias ,可以將那些繁瑣的命令自定義為我們容易記住的別名,可以大大提高我們的效率。 但是,alias 命令只對當前終端 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...