Linux內核啟動過程概述

来源:http://www.cnblogs.com/CrazyCatJack/archive/2016/12/06/6135435.html
-Advertisement-
Play Games

版權聲明:本文原創,轉載需聲明作者ID和原文鏈接地址。 Hi!大家好,我是CrazyCatJack。今天給大家帶來的是Linux內核啟動過程概述。希望能夠幫助大家更好的理解Linux內核的啟動,並且創造出自己的內核^_^ Linux的啟動代碼真的挺大,從彙編到C,從Makefile到LDS文件,需要 ...


 版權聲明:本文原創,轉載需聲明作者ID和原文鏈接地址。

 

  Hi!大家好,我是CrazyCatJack。今天給大家帶來的是Linux內核啟動過程概述。希望能夠幫助大家更好的理解Linux內核的啟動,並且創造出自己的內核^_^

  Linux的啟動代碼真的挺大,從彙編到C,從Makefile到LDS文件,需要理解的東西很多。畢竟Linux內核是由很多人,花費了巨大的時間和精力寫出來的。而且直到現在,這個世界上仍然有成千上萬的程式員在不斷完善Linux內核的代碼。今天我們主要講解的是Linux-2.6.22.6這個內核版本。說句實話,博主也不確定自己能夠講好今天這個題目,因為這個題目太大太難。但是博主有信心,將自己學會的內容清楚地告訴大家,希望大家也能夠有所收穫。

1.啟動文件head.S和head-common.S 

  首先,我們必須明確“我們為什麼要啟動Linux內核”。沒錯,當然是因為我們想要使用Linux系統,要明確我們的最終目的是使用Linux上的應用程式。這些應用程式可以是純軟體的,也可以是硬體相關的。博主是做嵌入式開發的,那麼我想要的當然就是用Linux內核來更好的控制我的硬體。無論是做機器人、無人機或者其他智能硬體這都是必然趨勢。首先我們來看內核的啟動文件head.S。

 

    .section ".text.head", "ax"
    .type    stext, %function
ENTRY(stext)
    msr    cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode
                        @ and irqs disabled
    mrc    p15, 0, r9, c0, c0        @ get processor id
    bl    __lookup_processor_type        @ r5=procinfo r9=cpuid
    movs    r10, r5                @ invalid processor (r5=0)?
    beq    __error_p            @ yes, error 'p'
    bl    __lookup_machine_type        @ r5=machinfo
    movs    r8, r5                @ invalid machine (r5=0)?
    beq    __error_a            @ yes, error 'a'
    bl    __create_page_tables

    ldr    r13, __switch_data        @ address to jump to after
                        @ mmu has been enabled
    adr    lr, __enable_mmu        @ return (PIC) address
    add    pc, r10, #PROCINFO_INITFUNC

  首先看這段彙編代碼,它主要是用來做一些內核啟動前的檢測:__lookup_processor_type 檢測內核是否支持當前CPU、__lookup_machine_type檢測是否支持當前單板,並且__create_page_tables創建頁表,__enable_mmu使能MMU。如果在一系列的自檢過程後發現不支持,則跳到__error_p或__error_a。這裡我們首先打開__lookup_machine_type。

 

    .type    __lookup_machine_type, %function
__lookup_machine_type:
    adr    r3, 3b
    ldmia    r3, {r4, r5, r6}
    sub    r3, r3, r4            @ get offset between virt&phys
    add    r5, r5, r3            @ convert virt addresses to
    add    r6, r6, r3            @ physical address space
1:    ldr    r3, [r5, #MACHINFO_TYPE]    @ get machine type
    teq    r3, r1                @ matches loader number?
    beq    2f                @ found
    add    r5, r5, #SIZEOF_MACHINE_DESC    @ next machine_desc
    cmp    r5, r6
    blo    1b
    mov    r5, #0                @ unknown machine
2:    mov    pc, lr

3:    .long    .
    .long    __arch_info_begin
    .long    __arch_info_end

  我們在arch\arm\kernel找到__lookup_machine_type被定義在head-common.S文件中。開始分析代碼:首先,讀出3b的地址給r3,這裡的3b就是下麵的那個3:所對應的虛擬地址。然後用ldmia指令將r3存放的虛擬地址分別存入r4,r5,r6。所以現在

r4=. ; r5=__arch_info_begin ; r6=__arch_info_end

然後用r3-r4求出偏移地址,再利用這個偏移地址求出r5和r6的實際物理地址。其中__arch_info_begin和__arch_info_end定義在內核目錄arch\arm\kernel下vmlinux.lds文件中,經過起始虛擬地址= (0xc0000000) + 0x00008000逐層疊加得到。

 

SECTIONS
{



 . = (0xc0000000) + 0x00008000;

 .text.head : {
  _stext = .;
  _sinittext = .;
  *(.text.head)
 }

 .init : { /* Init code and data        */
   *(.init.text)
  _einittext = .;
  __proc_info_begin = .;
   *(.proc.info.init)
  __proc_info_end = .;
  __arch_info_begin = .;
   *(.arch.info.init)
  __arch_info_end = .;

  這裡的__arch_info_begin和__arch_info_end中間存放的是段屬性為.arch.info.init的結構體。這裡我們可以直接在linux下查詢內核中包含.arch.info.init的文件。

 

Direction:include/asm-arm/arch.h
#define MACHINE_START(_type,_name) \ static const struct machine_desc __mach_desc_##_type \ __used \ __attribute__((__section__(
".arch.info.init"))) = { \
.nr = MACH_TYPE_##_type, \ .name = _name, #define MACHINE_END \ }
;
Direction:arch/arm/mach-s3c2440
MACHINE_START(S3C2440,
"SMDK2440") /* Maintainer: Ben Dooks <[email protected]> */ .phys_io = S3C2410_PA_UART, .io_pg_offst = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc, .boot_params = S3C2410_SDRAM_PA + 0x100, .init_irq = s3c24xx_init_irq, .map_io = smdk2440_map_io, .init_machine = smdk2440_machine_init, .timer = &s3c24xx_timer, MACHINE_END

  如圖所示,在include/asm-arm/arch.h中找到了定義的結構體類型machine_desc,並且在代碼中它的段屬性被強制定義成了.arch.info.init。這樣做的目的是在剛剛我們看到的vmlinux.lds鏈接腳本文件中,可以將具有.arch.info.init段屬性的結構體統一放在__arch_info_begin和__arch_info_end之間。非常便於處理。那麼現在我們將這個結構體展開,看看它的內容。也就是將arch/arm/mach-s3c2440中的參數傳入。展開後如下:

 

#define MACHINE_START(_type,_name)            \
static const struct machine_desc __mach_desc_S3C2440    \
 __used                            \
 __attribute__((__section__(".arch.info.init"))) = {    \
    .nr        = MACH_TYPE_S3C2440,        \
    .name        = "SMDK2440",
/* Maintainer: Ben Dooks <[email protected]> */
    .phys_io    = S3C2410_PA_UART,
    .io_pg_offst    = (((u32)S3C24XX_VA_UART) >> 18) & 0xfffc,
    .boot_params    = S3C2410_SDRAM_PA + 0x100,                    //0x30000100

    .init_irq    = s3c24xx_init_irq,
    .map_io        = smdk2440_map_io,
    .init_machine    = smdk2440_machine_init,
    .timer        = &s3c24xx_timer,
};

  現在我們看到,定義的結構體類型machine_desc,內容為.nr到.timer。我們可以看出這個結構體大概是存儲硬體信息。nr存放機器ID,name存放單板名稱,phys_io存放輸入輸出口,io_pg_offst存放IO的偏移地址,boot_params存放uboot傳給內核的啟動參數(TAG),init_irq存放的是中斷初始化信息,map_io為IO的映射表,init_machine存放的是單板的初始化信息,timer存放的是單板的定時器信息。

 

struct machine_desc {
    /*
     * Note! The first four elements are used
     * by assembler code in head-armv.S
     */
    unsigned int        nr;        /* architecture number    */
    unsigned int        phys_io;    /* start of physical io    */
    unsigned int        io_pg_offst;    /* byte offset for io 
                         * page tabe entry    */

    const char        *name;        /* architecture name    */
    unsigned long        boot_params;    /* tagged list        */

    unsigned int        video_start;    /* start of video RAM    */
    unsigned int        video_end;    /* end of video RAM    */

    unsigned int        reserve_lp0 :1;    /* never has lp0    */
    unsigned int        reserve_lp1 :1;    /* never has lp1    */
    unsigned int        reserve_lp2 :1;    /* never has lp2    */
    unsigned int        soft_reboot :1;    /* soft reboot        */
    void            (*fixup)(struct machine_desc *,
                     struct tag *, char **,
                     struct meminfo *);
    void            (*map_io)(void);/* IO mapping function    */
    void            (*init_irq)(void);
    struct sys_timer    *timer;        /* system tick timer    */
    void            (*init_machine)(void);
};

  我們打開arch.h文件,看到對machine_desc結構體的定義確實和我們剛剛所說的一樣。再回到head-common.S文件,這裡對mmap_switch定義:

 

    .type    __mmap_switched, %function
__mmap_switched:
    adr    r3, __switch_data + 4

    ldmia    r3!, {r4, r5, r6, r7}
    cmp    r4, r5                @ Copy data segment if needed
1:    cmpne    r5, r6
    ldrne    fp, [r4], #4
    strne    fp, [r5], #4
    bne    1b

    mov    fp, #0                @ Clear BSS (and zero fp)
1:    cmp    r6, r7
    strcc    fp, [r6],#4
    bcc    1b

    ldmia    r3, {r4, r5, r6, sp}
    str    r9, [r4]            @ Save processor ID
    str    r1, [r5]            @ Save machine type
    bic    r4, r0, #CR_A            @ Clear 'A' bit
    stmia    r6, {r0, r4}            @ Save control register values
    b    start_kernel

  mmap_switch做了很多工作,這裡我們看到有複製數據段,清BSS段,保存CPU的ID,保存機器ID,清‘A’位,保存控制寄存器的值,然後就到了C語言段——start_kernel函數。

 

2.C語言段——start_kernel

  

asmlinkage void __init start_kernel(void)
{
local_irq_disable(); early_boot_irqs_off(); early_init_irq_lock_class(); /* * Interrupts are still disabled. Do necessary setups, then * enable them */ lock_kernel(); tick_init(); boot_cpu_init(); page_address_init(); printk(KERN_NOTICE); printk(linux_banner); setup_arch(&command_line); setup_command_line(command_line); printk(KERN_NOTICE "Kernel command line: %s\n", boot_command_line); parse_early_param(); parse_args("Booting kernel", static_command_line, __start___param, __stop___param - __start___param, &unknown_bootoption); init_IRQ(); profile_init(); if (!irqs_disabled()) printk("start_kernel(): bug: interrupts were enabled early\n"); early_boot_irqs_on(); local_irq_enable(); console_init(); rest_init(); }

  接下來進入start_kernel啟動內核的C函數。上面是start_kernel的部分代碼。這部分代碼的主要作用是處理uboot傳遞來的參數,設置與體繫結構相關的環境,初始化控制台,最後執行應用程式,實現功能。這裡我把start_kernel函數的幾個主要功能的子函數逐層寫出,幫助大家理解start_kernel的功能結構。

 

start_kernel
    setup_arch(&command_line);
    setup_command_line(command_line);
    unknown_bootoption
        obsolete_checksetup    
    parse_early_param
        do_early_param        
    rest_init;
        kernel_init
            prepare_namespace
                mount_root
            init_post

  這裡每一個退格(TAB)都代表此函數被上一個函數調用(例如obsolete_checksetup是unknown_bootoption調用的函數)。setup_arch(&command_line)和setup_command_line(command_line)就是用來處理uboot傳遞進來的啟動參數的(處理TAG)。obsolete_checksetup從__setup_start到 __setup_end,調用用非early標識的函數;do_early_param從__setup_start到 __setup_end,調用用early標識的函數(但因為__setup_param(str, fn, fn, 0)中early賦值為0,所以不在這裡調用),所以我們主要用obsolete_checksetup。這在後面我們會提到。mount_root是掛載根文件系統,因為Linux上的應用程式最終要在根文件系統上運行。最後是init_post中運行應用程式。那麼現在就有一個問題,Linux內核是如何接收uboot傳來的根文件系統信息的呢?

 

bootcmd=nand read.jffs2 0x30007FC0 kernel; bootm 0x30007FC0
bootargs=noinitrd root=/dev/mtdblock3 init=/linuxrc console=ttySAC0

  上面是uboot啟動時列印的環境變數。其中我們能夠看到根文件系統掛載到第4個分區:root=/dev/mtdblock3 (從0分區開始)。上面我們提到過,setup_arch(&command_line)和setup_command_line(command_line)就是用來處理uboot傳遞進來的啟動參數的(處理TAG)。但這個處理只是簡單的複製粘貼而已,這兩個函數將TAG保存,但並未進行真正的處理。那麼真正告訴內核在哪裡掛載的函數是什麼呢?我們通過查看prepare_namespace可以看到一個saved_root_name。查找saved_root_name,發現在Do_mounts.c文件中有對它的調用:

 

static int __init root_dev_setup(char *line)
{
    strlcpy(saved_root_name, line, sizeof(saved_root_name));
    return 1;
}

__setup("root=", root_dev_setup);   //傳入一個字元串,一個函數

  根據我們之前的經驗,我們可以猜測這個__setup巨集,也是定義了一個結構體。通過查找__setup我們找到了它的巨集定義:

 

Dir:init.h
#define __setup(str, fn)                    \
    __setup_param(str, fn, fn, 0)


#define __setup_param(str, unique_id, fn, early)            \
    static char __setup_str_##unique_id[] __initdata = str;    \
    static struct obs_kernel_param __setup_##unique_id    \
        __attribute_used__                \
        __attribute__((__section__(".init.setup")))    \
        __attribute__((aligned((sizeof(long)))))    \
        = { __setup_str_##unique_id, fn, early }

  在init.h文件里,定義__setup等於__setup_param。那麼在__setup_param的巨集定義里,我們可以知道:它先定義了一個字元串,然後定義了一個結構體類型obs_kernel_param __setup。這個結構體的段屬性為.init.setup,內容為一個字元串,一個函數,還有early。具備這個屬性的結構體被鏈接腳本文件放到一起,從__setup_start到 __setup_end搜索調用。在vmlinux.lds中
  __setup_start = .;
   *(.init.setup)
  __setup_end = .;

  但是在Flash里沒有分區,只能和uboot一樣,將分區在代碼里寫死。一般在啟動Linux的時候,Linux會自動列印出分區的信息。這裡我的分區是這樣的:

 

Creating 4 MTD partitions on "NAND 256MiB 3,3V 8-bit":
0x00000000-0x00040000 : "bootloader"
0x00040000-0x00060000 : "params"
0x00060000-0x00260000 : "kernel"
0x00260000-0x10000000 : "root"

  我們搜索這個分區名 grep "\"bootloader\"" * -nR。在arch/arm/plat-s3c24xx中找到分區代碼:

 

static struct mtd_partition smdk_default_nand_part[] = {
    [0] = {
        .name   = "bootloader",
        .size   = 0x00040000,
        .offset    = 0,
    },
    [1] = {
        .name   = "params",
        .offset = MTDPART_OFS_APPEND,
        .size   = 0x00020000,
    },
    [2] = {
        .name   = "kernel",
        .offset = MTDPART_OFS_APPEND,
        .size   = 0x00200000,
    },
    [3] = {
        .name   = "root",
        .offset = MTDPART_OFS_APPEND,
        .size   = MTDPART_SIZ_FULL,
    }
};

  就是這樣,在處理完uboot傳遞的參數,進行CPU和單板的校驗,掛載根文件系統等一系列操作後,最終內核執行init_post()中的應用程式。內核啟動流程講解完畢^_^

 

題外話:最近博主在自學Linux kernel和Linux device driver,感覺有難度。但是還是很有意義的,因為能夠看到前輩的代碼,心裡真的很高興。我就希望自己也能夠修改Linux源代碼,寫出適合自己硬體的Linux系統。不僅如此,我還希望能夠將自己的代碼開源,分享給更多的人。完善Linux內核,讓它變得更快更方便是博主的最終目標。博主會繼續學習,然後把知識更好的分享給大家!

 

 

 

 

 

CCJ

2016-12-06 09:41:51

 

 

 

 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • CentOS 6.5 x86_64系統下安裝MySQL-5.6.10,並且根據生產環境需要做了一定的安全配置。 ...
  • ARM彙編語言(Assembly Language)是ARM CPU所能接受的最底層唯一語言(所有的高級語言最終都要轉換成彙編語言然後彙編成processor instruction codes)。ARM彙編的核心是ARM指令集。理解ARM彙編有助於理解底層processor內部的工作原理,有助於對... ...
  • ARM(Advanced RISC Machine)採用的是RISC精簡指令集,Load/Store架構,所有指令必須載入到寄存器才能進行運算。7種工作模式。31個通用寄存器,6個狀態寄存器。大小端可配置。 ...
  • 由於操作不當,導致git版本庫出了大問題,如下所示: 即提示xx文件是空的。在使用git log、git commit、git status等命令都會出此錯誤(文件名可能不一樣)。如果把.git刪掉,重新init,那會很輕鬆地暴力地解決了這個問題。但是,這樣的話之前的版本信息就全部丟失了,這並不是想 ...
  • 1、Linux,繼承魚Unix 2、Unix檔案系統的兩個重要概念 3、幾個主要的 Linux distributions 發行者網址: • Red Hat: http://www.redhat.com• Fedora: http://fedora.redhat.com• Mandriva: htt... ...
  • 黃山松發表於博客園:http://www.cnblogs.com/tomview/p/6137179.html #ifndef lxx_hss_auto_clipboard_hss#define lxx_hss_auto_clipboard_hss /************************... ...
  • 這是博主第一次寫博客,本人雖然目前就讀的專業屬電腦,但目前也是屬於新手上路的那一類人。正好不久前解決了一個困擾了我很久的問題 ,現在拿出來給大家分享一下。 上個學期學校的工作室給大家集中普及linux操作系統,最後大家集中安裝了Ubuntu16.04,畢竟是一個圖形化界面的linux系統,新手上手 ...
  • 概念 Linux內核從3.x開始引入設備樹的概念,用於實現 驅動代碼與設備信息相分離 。在設備樹出現以前,所有關於設備的具體信息都要寫在驅動里,一旦外圍設備變化,驅動代碼就要重寫。引入了設備樹之後,驅動代碼只負責處理驅動的邏輯,而關於設備的具體信息存放到設備樹文件中,這樣,如果只是硬體介面信息的變化 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...