go數據類型-map

来源:https://www.cnblogs.com/studyios/archive/2023/11/28/17863101.html
-Advertisement-
Play Games

線程池 線程池簡介 線程池(thread pool):一種線程的使用模式。線程過多會帶來調度的開銷,進而影響局部和整體性能。而線程池維護多個線程,等待著監督管理者分派併發執行的任務。這避免了在處理短時間任務時創建和銷毀線程的代價。線程池不僅能夠保證內核的充分使用,還能防止過分調度線程。 10多年前的 ...


go的map在面試時候經常會被問到。

最近看到群里有個被問到為什麼map的每個桶中只裝8個元素?

map 的結構

註:解決hash衝突還有一些別的方案:開放地址法 (往目標地址後面放)、再哈希法(再次hash)

底層定義

// A header for a Go map.
type hmap struct {
   // 個數 size of map,當使用len方法,返回就是這個值
	count     int // # live cells == size of map.  Must be first (used by len() builtin)
	flags     uint8
    // 桶的以2為底的對數,後面在查找和擴容都用到這個值
	B         uint8  // log_2 of # of buckets (can hold up to loadFactor * 2^B items)
	// 溢出桶的數量 這裡講了 approximate 不是精準的
    noverflow uint16 // approximate number of overflow buckets; see incrnoverflow for details
    // 哈希的種子,在進行哈希運算演算法是要用到
	hash0     uint32 // hash seed
    // 桶的數組,是 2^B個數,和B的定義對上了
	buckets    unsafe.Pointer // array of 2^B Buckets. may be nil if count==0.
    // 擴容時用於保存之前 buckets 的欄位
	oldbuckets unsafe.Pointer // previous bucket array of half the size, non-nil only when growing
    // 指示擴容進度,小於此地址的 buckets 遷移完成
	nevacuate  uintptr        // progress counter for evacuation (buckets less than this have been evacuated)
	extra *mapextra // optional fields
}

跟進看 buckets的結構:

bucketCnt  = abi.MapBucketCount =8 
// A bucket for a Go map.
type bmap struct {
	tophash [bucketCnt]uint8
  // Followed by bucketCnt keys and then bucketCnt elems.
  // Followed by an overflow pointer.
}

每個桶 定義了 有8個哈希值的容量。 這裡就解釋了為什麼一個桶只能放八個元素。

至於元素的存儲,在這裡沒有定義,主要是不能寫死類型。

但是在編譯期間,會把要存儲的key 和value寫進來;
最後還跟了一個 溢出指針。

整體的結構是這樣:

bmap的數量根據B確定,如果B為2,那麼bmap為4個,圖中B為3。

每個bmap容量為8,超過8個就要用到溢出桶。 意味著每個桶最多只能存儲8個元素。

map的創建

func main() {
	m := make(map[string]string, 10)
	fmt.Println(m)
}

看下是如何創建的:
通過看下彙編,發現最終調用了runtime.makemap()方法

go build -gcflags -S main.go
MOVL    $10, BX
XORL    CX, CX
PCDATA  $1, $0
NOP
CALL    runtime.makemap(SB)


func makemap(t *maptype, hint int, h *hmap) *hmap {
	mem, overflow := math.MulUintptr(uintptr(hint), t.Bucket.Size_)
	

	// initialize Hmap 初始化 hmap
	if h == nil {
		h = new(hmap)
	}
	h.hash0 = fastrand()
    // 對B進行賦值
	B := uint8(0)
	for overLoadFactor(hint, B) {
		B++
	}
	h.B = B
	if h.B != 0 {
		var nextOverflow *bmap
        // 這裡創建一個bucket的數組,而且也創建了一些溢出桶,用extra 存儲。
		h.buckets, nextOverflow = makeBucketArray(t, h.B, nil)
		if nextOverflow != nil {
			h.extra = new(mapextra)
			h.extra.nextOverflow = nextOverflow
		}
	}
	return h
}

這裡可以返回去看下 bmap 的最後一個參數:

   extra *mapextra // optional fields
  type mapextra struct {

	overflow    *[]*bmap
	oldoverflow *[]*bmap
	nextOverflow *bmap
}

通過上面能看到,給 h.extra.nextOverflow = nextOverflow 存放了下一個可用的溢出桶的位置。

map的訪問

1. 計算桶位

  1. 通過key + hash0種子 通過hash演算法,等到一串32位的字元串。具體多少位與操作系統有關。
  1. 取哈希值的後B位。圖中B為3,得到了 010 就是 2號桶。
  1. 得到的值 就是 桶的位置。

2. 訪問進行匹配

這裡有個 tophash,只存儲了hash值的前8位。map裡面挺多8的。

開始對比key為a的哈希值的前8位,如果找到了,則需要對比下key,因為前8位可能會有一樣的

如果不匹配,則繼續往後找,溢出桶,找到則返回值。

如果都找不到,則沒有這個key。

map寫入

基本和查找類似。

map擴容

當map 溢出桶太多時會導致嚴重的性能下降,就需要對map的桶進行擴容。

可能會觸發擴容的情況: 後面會具體解釋

裝載因數超過 6.5(平均每個槽6.5個key)

使用了太多溢出桶(溢出桶超過了普通桶)

具體實現在 runtime.mapassign()中:

//截取其中的關鍵代碼:
// If we hit the max load factor or we have too many overflow buckets,
// and we're not already in the middle of growing, start growing.
if !h.growing() && (overLoadFactor(h.count+1, h.B) || tooManyOverflowBuckets(h.noverflow, h.B)) {
	hashGrow(t, h)
	goto again // Growing the table invalidates everything, so try again
}

  // overLoadFactor reports whether count items placed in 1<<B buckets is over loadFactor.
func overLoadFactor(count int, B uint8) bool {
	return count > bucketCnt && uintptr(count) > loadFactorNum*(bucketShift(B)/loadFactorDen)
}

loadFactor:=count / (2^B) 即 裝載因數 = map中元素的個數 / map中當前桶的個數

通過計算公式我們可以得知,裝載因數是指當前map中,每個桶中的平均元素個數。

如果沒有溢出桶,那麼一個桶中最多有8個元素,當平均每個桶中的數據超過了6.5個,那就意味著當前容量要不足了,發生擴容。

  func tooManyOverflowBuckets(noverflow uint16, B uint8) bool {
	// If the threshold is too low, we do extraneous work.
	// If the threshold is too high, maps that grow and shrink can hold on to lots of unused memory.
	// "too many" means (approximately) as many overflow buckets as regular buckets.
	// See incrnoverflow for more details.
	if B > 15 {
		B = 15
	}
	// The compiler doesn't see here that B < 16; mask B to generate shorter shift code.
	return noverflow >= uint16(1)<<(B&15)
}

當 B < 15 時,如果overflow的bucket數量超過 2^B。
當 B >= 15 時,overflow的bucket數量超過 2^15。

map的擴容的類型

  1. 等量擴容:數據不多但是溢出桶太多了 (整理)
  2. 翻倍擴容:數據太多了

第一步:

創建一組新桶

oldbuckets 指向原有的桶數組

buckets 指向新的桶數組

map標記為擴容狀態

實現源碼:

func hashGrow(t *maptype, h *hmap) {
	
	bigger := uint8(1)
	if !overLoadFactor(h.count+1, h.B) {
		bigger = 0
		h.flags |= sameSizeGrow
	}
	oldbuckets := h.buckets
    //  新建桶
	newbuckets, nextOverflow := makeBucketArray(t, h.B+bigger, nil)

	flags := h.flags &^ (iterator | oldIterator)
	if h.flags&iterator != 0 {
		flags |= oldIterator
	}
	//更改B的值
	h.B += bigger
   // 更改map狀態
	h.flags = flags
    // oldbuckets 指向原來的
	h.oldbuckets = oldbuckets
    // buckets 指向新桶
	h.buckets = newbuckets
	h.nevacuate = 0
	h.noverflow = 0
    
    // 賦值新的溢出桶
	if h.extra != nil && h.extra.overflow != nil {
		if h.extra.oldoverflow != nil {
			throw("oldoverflow is not nil")
		}
		h.extra.oldoverflow = h.extra.overflow
		h.extra.overflow = nil
	}
	if nextOverflow != nil {
		if h.extra == nil {
			h.extra = new(mapextra)
		}
		h.extra.nextOverflow = nextOverflow
	}
}

步驟2

將所有的數據從!日桶驅逐到新桶
採用漸進式驅逐
每次操作一個日桶時,將1日桶數據驅逐到新桶
讀取時不進行驅逐,只判斷讀取新桶還是舊桶


例如圖中:原本的2號桶中的數據,要麼去新的2號010,要麼去新的6號桶。110

這部分的代碼也在map.go

在 mapassign中有這個邏輯:
func mapassign(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer {

    if h.growing() {
    		growWork(t, h, bucket)
    	} 
}

func growWork(t *maptype, h *hmap, bucket uintptr) {
	// 具體的邏輯就在這個 evacuate中實現的。
	evacuate(t, h, bucket&h.oldbucketmask())

	// evacuate one more oldbucket to make progress on growing
	if h.growing() {
		evacuate(t, h, h.nevacuate)
	}
}

步驟3

  所有的日桶驅逐完成後
  oldbuckets回收

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近,相信大家一定被這麼個動效給刷屏了: 以至於,基於這個效果的二次創作層出不窮,眼花繚亂。 基於跨視窗通信的彈彈球: 基於跨視窗通信的 Flippy Bird: 我也嘗試製作了一個跨 Tab 視窗的 CSS 動畫聯動,效果如下: 代碼不多,核心代碼 200 行,感興趣的可以戳這裡:Github - ...
  • 專欄分享:vue2源碼專欄,vue3源碼專欄,vue router源碼專欄,玩具項目專欄,硬核💪推薦🙌 歡迎各位ITer關註點贊收藏🌸🌸🌸 Vue3中響應數據核心是 reactive , reactive 的實現是由 proxy 加 effect 組合,上一章節我們利用 proxy 實現了 ...
  • 自增自減運算符 1、基本使用 內置提供 ++、--運算符 是用於將變數本身進行加1或者減1操作 // 1、基本使用 var i = 10; i++;//等價於語句 i+=1 console.log(i);//11 var m = 10; m--; console.log(m) 2、前置與後置的區別 ...
  • 一、定義 定義一個語言的文法,並且建立一個解釋器來解釋該語言中的句子,這裡的“語言”是指使用規定格式和語法的代碼。解釋器模式是一種行為型模式。 二、描述 解釋器模式是一種使用頻率相對較低但學習難度較大的設計模式,它主要用於描述如何使用面向對象語言構成一個簡單的語言解釋器,包含以下四個角色: 1、Ab ...
  • 推薦一本日本網友Kenji Hiranabe寫的《線性代數的藝術》。這本書是基於MIT大牛Gilbert Strang教授的《每個人的線性代數》製作的。 雖然《線性代數的藝術》這本書僅僅只有12頁的內容,就把線性代數的重點全畫完了,清晰明瞭。 《線性代數的藝術》PDF版本:https://pan.q ...
  • 懶載入是Spring框架中的一個重要特性,它允許我們將bean的實例化推遲到第一次使用時。懶載入的主要用途是提高應用程式的啟動性能,減少不必要的資源消耗。 一、懶載入的用途 在大型的應用程式中,有些bean可能只在特定的條件下才會被使用到。如果在應用程式啟動時就實例化所有的bean,會導致啟動時間變 ...
  • 一、參考 https://ericniebler.com/2020/11/08/structured-concurrency/ 二、總結 1. 結構化併發是什麼-概述 是什麼:一種確保子操作在父操作之前完成的方式,類似函數在調用函數之前完成。 最典型的結構化併發:C++20的協程 意義:它通過使非同步 ...
  • 十八、函數(一) 1、函數概述 1)函數帶來的好處 ①代碼模塊化,便於閱讀維護 ②代碼模塊化以後,能夠實現分工合作 ③減少重覆代碼,降低工作流 2)函數的語法 //函數的語法 返回類型 函數名稱(參數,參數,參數,參數) //參數的語法包括:參數類型 參數名稱 { 函數的功能區; return 返回 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...