面試官:請說一下如何優化結構體的性能?

来源:https://www.cnblogs.com/wangzhongyang/archive/2023/03/07/17187197.html
-Advertisement-
Play Games

使用記憶體對齊機制優化結構體性能,妙啊! 可以簡單理解為:將對齊繫數小的欄位,儘可能放在一起,儘量減少空白填充。 掌握了記憶體對齊機制後,結構體Struct的優化,調整下欄位順序,效果立竿見影。記憶體對齊其實就是典型的空間換時間的方式,來達到優化的目的。牢記對齊原則,對實際場景進行分析,減少空白填充。 ...


使用記憶體對齊機制優化結構體性能,妙啊!

前言

之前分享過2篇結構體文章:
10秒改struct性能直接提升15%,產品姐姐都誇我好棒Go語言空結構體這3種妙用,你知道嗎? 得到了大家的好評。

這篇繼續分享進階內容:

結構體的定義,大家都很熟悉,想要定義出更節省記憶體空間的結構體,可不是一件簡單的事。

我們必須掌握Go的結構體記憶體對齊機制,才能做出相應的優化:節省記憶體並提高性能。

先來看個例子

下麵定義兩個結構體,欄位都一樣,只是部分欄位稍微調整了一下順序。

但輸出的結果卻完全不同:一個順序調整就節省了8個位元組,太神奇了。

type BadSt struct {
  A int32
  B int64
  C bool
}

type GoodSt struct {
  A int32
  C bool
  B int64
}

func main() {
  bad := BadSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(bad))//輸出結果:24
  good := GoodSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(good))//輸出結果:16
}

為什麼bad占用24位元組,而good卻只占用16位元組呢

想要解開這個問題,我們得先來學習一下記憶體對齊機制,然後再來進一步分析。

原理講解

基本概念

為了能讓CPU可以更快的存儲、讀取到各個欄位,Go編譯器會幫我們把結構體做數據的對齊。

所謂的數據對齊,是指記憶體地址的大小是所存儲數據大小的整數倍(按位元組為單位),以便CPU可以一次將該數據從記憶體中讀取出來,減少了讀取次數。

編譯器通過在結構體的各個欄位之間填充一些空白,來達到對齊的目的

CPU訪問記憶體

CPU 訪問記憶體時,並不是逐個位元組訪問,而是以機器字(word)為單位進行訪問

比如 64位CPU的字長(word size)為8bytes,那麼CPU訪問記憶體的單位也是8位元組,每次載入的記憶體數據也是固定的若幹字長,如8words(64bytes)、16words(128bytes)等

對齊繫數

不同硬體平臺占用的大小和對齊值都可能是不一樣的,每個特定平臺上的編譯器都有自己的預設"對齊繫數",32位系統對齊繫數是4,64位系統對齊繫數是8

不同類型的對齊繫數也可能不一樣,使用Go語言中的unsafe.Alignof函數可以返回相應類型的對齊繫數,對齊繫數都符合2^n這個規律,最大也不會超過8

func main() {
  fmt.Printf("bool:   %d\n", unsafe.Alignof(bool(true)))
  fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
  fmt.Printf("int:    %d\n", unsafe.Alignof(int(0)))
  fmt.Printf("int32:  %d\n", unsafe.Alignof(int32(0)))
  fmt.Printf("int64:  %d\n", unsafe.Alignof(int64(0)))
  fmt.Printf("float64:  %d\n", unsafe.Alignof(float64(0)))
  fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
}
//輸出結果:
//bool:   1
//string: 8
//int:    8
//int32:  4
//int64:  8
//float64:8
//float32:4

對齊原則

  1. 結構體變數中成員的偏移量必須是成員大小的整數倍
  2. 整個結構體的記憶體大小必須是最大位元組的整數倍(結構體的記憶體占用是1/4/8/16byte…)

案例分析

type BadSt struct {
  A int32
  B int64
  C bool
}

BadSt結構體,占用24個位元組

分析過程:

  1. 欄位A 4位元組:先計算偏移量,最開頭下標為0,0%4=0,正好整除,先占用4個位元組;
  2. 欄位B 8位元組:下標4-7,對8都不能整除,則填充空白,下標8可以整除,所以下標8-15 8個位元組為欄位B的存儲使用;
  3. 欄位C 1位元組:下標16,對1可以整除,所以下標16則用作欄位C的存儲;
  4. 最後,該結構體欄位最大位元組為8且目前已占用17位元組,要保證是整數倍,所以最後面需要填充7個位元組,占滿24位元組,才能滿足條件(對齊原則2)。

GoodSt結構體,占用16個位元組

type GoodSt struct {
  A int32
  C bool
  B int64
}

分析過程:

  1. 欄位A 4位元組:先計算偏移量,最開頭下標為0,0%4=0,正好整除,先占用4個位元組;
  2. 欄位C 1位元組:下標4,對1可以整除,所以下標4則用作欄位C的存儲;
  3. 欄位B 8位元組:下標5-7,對8都不能整除,則填充空白,下標8可以整除,所以下標8-15 8個位元組為欄位B的存儲使用;
  4. 最後,該結構體欄位最大位元組為8且目前已占用16位元組,正好是整數倍,所以後面不再需要填充空白了。

總結

通過上文的原理講解和案例分析,我們發現記憶體對齊機制並不複雜。

可以簡單理解為:將對齊繫數小的欄位,儘可能放在一起,儘量減少空白填充。

掌握了記憶體對齊機制後,結構體Struct的優化,調整下欄位順序,效果立竿見影。記憶體對齊其實就是典型的空間換時間的方式,來達到優化的目的。牢記對齊原則,對實際場景進行分析,減少空白填充

原文鏈接:https://mp.weixin.qq.com/s/64eWxeB0xxA65HZc65axHQ

一起學習

需要簡歷優化和就業輔導的朋友可以私信我,也歡迎關註我的公眾號:

我的文章首發在我的公眾號: 程式員升職加薪之旅,歡迎大家關註,第一時間閱讀我的文章。

也歡迎大家關註我,點贊、留言、轉發。你的支持,是我更文的最大動力!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Mybatis-Plus 代碼生成器工具類 對 MP 的代碼生成器寫一個簡單的工具類: public class Main { public static String scanner(String tip) { Scanner scanner = new Scanner(System.in); S ...
  • JDK已經如火如荼的更新到了JDK 19,集團內也在推AJDK 11的升級,升級已然是一個大趨勢。本文主要是對體育營銷場景升級JDK 11,進行了整理與總結,希望對大家有所幫助。 ...
  • 簡述Xss 一,什麼是Xss 攻擊 百度百科: ​ XSS攻擊通常指的是通過利用網頁開發時留下的漏洞,通過巧妙的方法註入惡意指令代碼到網頁,使用戶載入並執行攻擊者惡意製造的網頁程式。這些惡意網頁程式通常是JavaScript,但實際上也可以包括Java、 VBScript、ActiveX、 Flas ...
  • 雖然不喜歡IIS,不過有些項目又必須部署在windows上,windows下部署django的方案有IIS + wfastcgi,apache + mod_wsgi,也有超簡單的部署方式如:nginx + waitress,本文主要講的是最後一種部署方式。 程式文件 隨便找個目錄放置好程式文件 下載 ...
  • 1、官網下載libcurl https://curl.se/download/curl-7.88.1.tar.gz 2、解壓執行curl目錄下的buildconf.bat,然後cd winbuild 3、編譯 windows下編譯(MT): 32-debug: nmake /f Makefile.v ...
  • 來源:blog.csdn.net/qq_41698074/article/details/108502976 前言 雖然 stream在 Java8 中就已經被引入,但是大多數人卻沒有去使用這個十分有用的特性,本文就通過介紹幾個通過使用stream讓代碼更簡潔、可讀,來讓你瞭解stream的方便之處 ...
  • 連接層 最上層是一些客戶端和鏈接服務,包含本地sock 通信和大多數基於客戶端/服務端工具實現的類似於 TCP/IP的通信。主要完成一些類似於連接處理、授權認證、及相關的安全方案。在該層上引入了線程 池的概念,為通過認證安全接入的客戶端提供線程。同樣在該層上可以實現基於SSL的安全鏈接。服務 器也會 ...
  • Whay need the CMake? 如果只是構建一個只有一個main.cpp的小型項目,那麼確實不需要CMake, 直接GCC、G++編譯,或者寫個build.sh腳本即可, 不需要把簡單的問題搞複雜化。 $ g++ main.cpp -o cmake_hello 但是如果你的項目分了很多模塊 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...