大端模式和小端模式

来源:https://www.cnblogs.com/wy9264/archive/2019/03/11/10513974.html
-Advertisement-
Play Games

轉載:https://www.cnblogs.com/little-white/p/3236548.html 一、大端模式和小端模式的起源 關於大端小端名詞的由來,有一個有趣的故事,來自於Jonathan Swift的《格利佛游記》:Lilliput和Blefuscu這兩個強國在過去的36個月中一直 ...


轉載:https://www.cnblogs.com/little-white/p/3236548.html

一、大端模式和小端模式的起源

        關於大端小端名詞的由來,有一個有趣的故事,來自於Jonathan Swift的《格利佛游記》:Lilliput和Blefuscu這兩個強國在過去的36個月中一直在苦戰。戰爭的原因:大家都知道,吃雞蛋的時候,原始的方法是打破雞蛋較大的一端,可以那時的皇帝的祖父由於小時侯吃雞蛋,按這種方法把手指弄破了,因此他的父親,就下令,命令所有的子民吃雞蛋的時候,必須先打破雞蛋較小的一端,違令者重罰。然後老百姓對此法令極為反感,期間發生了多次叛亂,其中一個皇帝因此送命,另一個丟了王位,產生叛亂的原因就是另一個國家Blefuscu的國王大臣煽動起來的,叛亂平息後,就逃到這個帝國避難。據估計,先後幾次有11000餘人情願死也不肯去打破雞蛋較小的端吃雞蛋。這個其實諷刺當時英國和法國之間持續的衝突。Danny Cohen一位網路協議的開創者,第一次使用這兩個術語指代位元組順序,後來就被大家廣泛接受。
 

二、什麼是大端和小端

舉一個例子,比如數字0x12 34 56 78在記憶體中的表示形式。

1)大端模式:Big-Endian就是高位位元組排放在記憶體的低地址端,低位位元組排放在記憶體的高地址端。

            (其實大端模式才是我們直觀上認為的模式,和字元串存儲的模式差類似)

低地址 --------------------> 高地址
0x12  |  0x34  |  0x56  |  0x78

2)小端模式:Little-Endian就是低位位元組排放在記憶體的低地址端,高位位元組排放在記憶體的高地址端。

低地址 --------------------> 高地址
0x78  |  0x56  |  0x34  |  0x12

3)下麵是兩個具體例子: 

16bit寬的數0x1234在Little-endian模式(以及Big-endian模式)CPU記憶體中的存放方式(假設從地址0x4000開始存放)為:   
記憶體地址 小端模式存放內容 大端模式存放內容
0x4000 0x34 0x12
0x4001 0x12 0x34

32bit寬的數0x12345678在Little-endian模式以及Big-endian模式)CPU記憶體中的存放方式(假設從地址0x4000開始存放)為:

記憶體地址 小端模式存放內容 大端模式存放內容
0x4000 0x78 0x12
0x4001 0x56 0x34
0x4002 0x34 0x56
0x4003 0x12 0x78
 

 4)大端小端沒有誰優誰劣,各自優勢便是對方劣勢:

小端模式 :強制轉換數據不需要調整位元組內容,1、2、4位元組的存儲方式一樣。
大端模式 :符號位的判定固定為第一個位元組,容易判斷正負。

三、數組在大端小端情況下的存儲:

  以unsigned int value = 0x12345678為例,分別看看在兩種位元組序下其存儲情況,我們可以用unsigned char buf[4]來表示value:
  Big-Endian: 低地址存放高位,如下:
高地址
        ---------------
        buf[3] (0x78) -- 低位
        buf[2] (0x56)
        buf[1] (0x34)
        buf[0] (0x12) -- 高位
        ---------------
        低地址
Little-Endian: 低地址存放低位,如下:
高地址
        ---------------
        buf[3] (0x12) -- 高位
        buf[2] (0x34)
        buf[1] (0x56)
        buf[0] (0x78) -- 低位
        --------------
低地址

四、為什麼會有大小端模式之分呢?

      這是因為在電腦系統中,我們是以位元組為單位的,每個地址單元都對應著一個位元組,一個位元組為8bit。但是在C語言中除了8bit的char之外,還有16bit的short型,32bit的long型(要看具體的編譯器),另外,對於位數大於8位的處理器,例如16位或者32位的處理器,由於寄存器寬度大於一個位元組,那麼必然存在著一個如果將多個位元組安排的問題。因此就導致了大端存儲模式和小端存儲模式。例如一個16bit的short型x,在記憶體中的地址為0x0010,x的值為0x1122,那麼0x11為高位元組,0x22為低位元組。對於大端模式,就將0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,剛好相反。我們常用的X86結構是小端模式,而KEIL C51則為大端模式。很多的ARM,DSP都為小端模式。有些ARM處理器還可以由硬體來選擇是大端模式還是小端模式。

五、如何判斷機器的位元組序

可以編寫一個小的測試程式來判斷機器的位元組序:

 

複製代碼
BOOL IsBigEndian()  
{  
    int a = 0x1234;  
    char b =  *(char *)&a;  //通過將int強制類型轉換成char單位元組,通過判斷起始存儲位置。即等於 取b等於a的低地址部分  
    if( b == 0x12)  
    {  
        return TRUE;  
    }  
    return FALSE;  
}
複製代碼

聯合體union的存放順序是所有成員都從低地址開始存放,利用該特性可以輕鬆地獲得了CPU對記憶體採用Little-endian還是Big-endian模式讀寫:

複製代碼
BOOL IsBigEndian()  
{  
    union NUM  
    {  
        int a;  
        char b;  
    }num;  
    num.a = 0x1234;  
    if( num.b == 0x12 )  
    {  
        return TRUE;  
    }  
    return FALSE;  
}
複製代碼

六、常見的位元組序

一般操作系統都是小端,而通訊協議是大端的。

4.1 常見CPU的位元組序

Big Endian : PowerPC、IBM、Sun
Little Endian : x86、DEC
ARM既可以工作在大端模式,也可以工作在小端模式。
 

4.2 常見文件的位元組序

Adobe PS – Big Endian
BMP – Little Endian
DXF(AutoCAD) – Variable
GIF – Little Endian
JPEG – Big Endian
MacPaint – Big Endian
RTF – Little Endian
 
另外,Java和所有的網路通訊協議都是使用Big-Endian的編碼。

七、如何進行轉換

對於字數據(16位):(程式中的“\”表示當前行和下一行是同一行)

#define BigtoLittle16(A)   (( ((uint16)(A) & 0xff00) >> 8)    | \  
                                       (( (uint16)(A) & 0x00ff) << 8))  

對於雙字數據(32位):

#define BigtoLittle32(A)   ((( (uint32)(A) & 0xff000000) >> 24) | \  
                                       (( (uint32)(A) & 0x00ff0000) >> 8)   | \  
                                       (( (uint32)(A) & 0x0000ff00) << 8)   | \  
                                       (( (uint32)(A) & 0x000000ff) << 24))  

八、從軟體的角度理解端模式

        從軟體的角度上,不同端模式的處理器進行數據傳遞時必須要考慮端模式的不同。如進行網路數據傳遞時,必須要考慮端模式的轉換。在Socket介面編程中,以下幾個函數用於大小端位元組序的轉換。

#define ntohs(n)     //16位數據類型網路位元組順序到主機位元組順序的轉換  
#define htons(n)     //16位數據類型主機位元組順序到網路位元組順序的轉換  
#define ntohl(n)      //32位數據類型網路位元組順序到主機位元組順序的轉換  
#define htonl(n)      //32位數據類型主機位元組順序到網路位元組順序的轉換  

其中互聯網使用的網路位元組順序採用大端模式進行編址,而主機位元組順序根據處理器的不同而不同,如PowerPC處理器使用大端模式,而Pentuim處理器使用小端模式。
       大端模式處理器的位元組序到網路位元組序不需要轉換,此時ntohs(n)=n,ntohl = n;而小端模式處理器的位元組序到網路位元組必須要進行轉換,此時ntohs(n) = __swab16(n),ntohl = __swab32(n)。__swab16與__swab32函數定義如下所示。

複製代碼
#define ___swab16(x)  
{  
            __u16 __x = (x);  
            ((__u16)(  
                        (((__u16)(__x) & (__u16)0x00ffU) << 8) |  
                        (((__u16)(__x) & (__u16)0xff00U) >> 8) ));  
}  
  
  
#define ___swab32(x)  
{  
            __u32 __x = (x);  
            ((__u32)(  
                        (((__u32)(__x) & (__u32)0x000000ffUL) << 24) |  
                        (((__u32)(__x) & (__u32)0x0000ff00UL) << 8) |  
                        (((__u32)(__x) & (__u32)0x00ff0000UL) >> 8) |  
                        (((__u32)(__x) & (__u32)0xff000000UL) >> 24) ));  
}  
複製代碼

 PowerPC處理器提供了lwbrx,lhbrx,stwbrx,sthbrx四條指令用於處理位元組序的轉換以優化__swab16和__swap32這類函數。此外PowerPC處理器中的rlwimi指令也可以用來實現__swab16和__swap32這類函數。

       在對普通文件進行處理也需要考慮端模式問題。在大端模式的處理器下對文件的32,16位讀寫操作所得到的結果與小端模式的處理器不同。單純從軟體的角度理解上遠遠不能真正理解大小端模式的區別。事實上,真正的理解大小端模式的區別,必須要從系統的角度,從指令集,寄存器和數據匯流排上深入理解,大小端模式的區別。

 

九、從系統的角度理解端模式

先補充兩個關鍵詞,MSB和LSB:
    MSB:MoST Significant Bit ------- 最高有效位
        LSB:Least Significant Bit ------- 最低有效位  

        處理器在硬體上由於端模式問題在設計中有所不同。從系統的角度上看,端模式問題對軟體和硬體的設計帶來了不同的影響,當一個處理器系統中大小端模式同時存在時,必須要對這些不同端模式的訪問進行特殊的處理。
       PowerPC處理器主導網路市場,可以說絕大多數的通信設備都使用PowerPC處理器進行協議處理和其他控制信息的處理,這也可能也是在網路上的絕大多數協議都採用大端編址方式的原因。因此在有關網路協議的軟體設計中,使用小端方式的處理器需要在軟體中處理端模式的轉變。而Pentium主導個人機市場,因此多數用於個人機的外設都採用小端模式,包括一些在網路設備中使用的PCI匯流排,Flash等設備,這也要求在硬體設計中註意端模式的轉換。
       本文提到的小端外設是指這種外設中的寄存器以小端方式進行存儲,如PCI設備的配置空間,NOR FLASH中的寄存器等等。對於有些設備,如DDR顆粒,沒有以小端方式存儲的寄存器,因此從邏輯上講並不需要對端模式進行轉換。在設計中,只需要將雙方數據匯流排進行一一對應的互連,而不需要進行數據匯流排的轉換。
       如果從實際應用的角度說,採用小端模式的處理器需要在軟體中處理端模式的轉換,因為採用小端模式的處理器在與小端外設互連時,不需要任何轉換。而採用大端模式的處理器需要在硬體設計時處理端模式的轉換。大端模式處理器需要在寄存器,指令集,數據匯流排及數據匯流排與小端外設的連接等等多個方面進行處理,以解決與小端外設連接時的端模式轉換問題。在寄存器和數據匯流排的位序定義上,基於大小端模式的處理器有所不同。
       一個採用大端模式的32位處理器,如基於E500內核的MPC8541,將其寄存器的最高位msb(most significant bit)定義為0,最低位lsb(lease significant bit)定義為31;而小端模式的32位處理器,將其寄存器的最高位定義為31,低位地址定義為0。與此向對應,採用大端模式的32位處理器數據匯流排的最高位為0,最高位為31;採用小端模式的32位處理器的數據匯流排的最高位為31,最低位為0。         
       大小端模式處理器外部匯流排的位序也遵循著同樣的規律,根據所採用的數據匯流排是32位,16位和8位,大小端處理器外部匯流排的位序有所不同。大端模式下32位數據匯流排的msb是第0位,MSB是數據匯流排的第0~7的欄位;而lsb是第31位,LSB是第24~31欄位。小端模式下32位匯流排的msb是第31位,MSB是數據匯流排的第31~24位,lsb是第0位,LSB是7~0欄位。大端模式下16位數據匯流排的msb是第0位,MSB是數據匯流排的第0~7的欄位;而lsb是第15位,LSB是第8~15欄位。小端模式下16位匯流排的msb是第15位,MSB是數據匯流排的第15~7位,lsb是第0位,LSB是7~0欄位。大端模式下8位數據匯流排的msb是第0位,MSB是數據匯流排的第0~7的欄位;而lsb是第7位,LSB是第0~7欄位。小端模式下8位匯流排的msb是第7位,MSB是數據匯流排的第7~0位,lsb是第0位,LSB是7~0欄位。
         由上分析,我們可以得知對於8位,16位和32位寬度的數據匯流排,採用大端模式時數據匯流排的msb和MSB的位置都不會發生變化,而採用小端模式時數據匯流排的lsb和LSB位置也不會發生變化。
         為此,大端模式的處理器對8位,16位和32位的記憶體訪問(包括外設的訪問)一般都包含第0~7欄位,即MSB。小端模式的處理器對8位,16位和32位的記憶體訪問都包含第7~0位,小端方式的第7~0欄位,即LSB。由於大小端處理器的數據匯流排其8位,16位和32位寬度的數據匯流排的定義不同,因此需要分別進行討論在系統級別上如何處理端模式轉換。在一個大端處理器系統中,需要處理大端處理器對小端外設的訪問。

十、實際中的例子

       雖然很多時候,位元組序的工作已由編譯器完成了,但是在一些小的細節上,仍然需要去仔細揣摩考慮,尤其是在乙太網通訊、MODBUS通訊、軟體移植性方面。這裡,舉一個MODBUS通訊的例子。在MODBUS中,數據需要組織成數據報文,該報文中的數據都是大端模式,即低地址存高位,高地址存低位。假設有一16位緩衝區m_RegMW[256],因為是在x86平臺上,所以記憶體中的數據為小端模式:m_RegMW[0].low、m_RegMW[0].high、m_RegMW[1].low、m_RegMW[1].high……
為了方便討論,假設m_RegMW[0] = 0x3456; 在記憶體中為0x56、0x34。
       現要將該數據發出,如果不進行數據轉換直接發送,此時發送的數據為0x56,0x34。而Modbus是大端的,會將該數據解釋為0x5634而非原數據0x3456,此時就會發生災難性的錯誤。所以,在此之前,需要將小端數據轉換成大端的,即進行高位元組和低位元組的交換,此時可以調用步驟五中的函數BigtoLittle16(m_RegMW[0]),之後再進行發送才可以得到正確的數據。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 需要對文字列表進行處理,然後用到DataGridView控制項來處理,記錄一下。效果如下: 主要是想通過禁用和取消單元格選擇來使圖標單元格呈現出滑鼠點擊的效果。因為有個單元格選擇的問題困擾著我。 是這樣來處理的: 1.在CellStateChanged事件裡面對指定單元格進行禁用處理,好比column ...
  • 寫在前面 併發編程一直都存在,只不過過去的很長時間里,比較難以實現,隨著互聯網的發展,人口紅利的釋放,更加友好的支持併發編程已經成了主流編程語言的標配,而對於軟體開發人員來說,沒有玩過併發編程都會有點不好意思。本系列文章將會以C#語言為主,詳細介紹併發編程。 什麼是併發編程,其實很簡單,併發編程就是... ...
  • 一、創建項目 1.創建一個.netframework的控制台項目命名為Crawler 2.安裝nuget包搜索名稱Ivony.Html.AIO,使用該類庫什麼方便類似jqury的選擇器可以根據類名或者元素類型來匹配元素,無需要寫正則表達式。 3.創建一個圖片類Image 一、抓取頁面圖片 1.拿到所 ...
  • 假設Node和npm已經安裝 npm install -g @servicestack/cli 執行命令dotnet-new selfhost SSHost 這樣就創建了ServiceStack的控制台程式,用VS2017解決方案,添加如下代碼 項目SSHost里添加配置文件appsettings. ...
  • 上一篇咱們提到了在macOS下選進行開發。咱們已經把工具準備完成了。現在咱們做一個簡單的DEMO創建WEB程式之前咱們已經創建過WEB程式,並且成功的運行過數據現在咱們創建一個頁面,並顯示出來。在咱們的系統中,最常見的應該是Grid列表。下麵咱們創建一個列表界面Grid列表首先創建一個Model一... ...
  • 我基本上從0開始學習編程,運算符基本上跳過,因為知道了 “=”這個符號相當於賦值,然後“==”才是等於,其他和普通運算符號差不都,也就跳過了。 最基礎的賦值那種,我看了下代碼,似乎沒什麼難度,估計新手和我一樣,有一本書,大概看看就懂了,我從我遇到的問題開始。 我學習時候,發現C#接收用戶輸入的都是字 ...
  • 創建一個 swarm 服務: docker swarm init --listen-addr ip:port (default ) 查看加入 swarm 服務的命令: docker swarm join-token [worker|manager] 查看 swarm 節點命令:只能在manager上 ...
  • 0x00 背景最近公司的舊群暉伺服器Raid6,因為同時壞了兩塊硬碟存儲池損毀,所以領導決定買了Dell R730自己搭NAS,選來選去最後選了FreeNAS,這裡記錄一些踩過的坑。0x01 問題:“No Systemdisk”用UltraISO和FreeNas官網下的iso鏡像製作啟動盤後,出現“... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...