golang中的map

来源:https://www.cnblogs.com/liuyuede123/archive/2022/10/21/16813826.html
-Advertisement-
Play Games

腳本介紹 下方是演示的表結構: CREATE TABLE `index_test03` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `name` varchar(20) NOT NULL, `create_time` varchar(20) NOT NULL ...


0.1、索引

https://waterflow.link/articles/1666339004798

1、map的結構

map提供了鍵值對的無序集合,所有的鍵都是不重覆的。在go中map是基於bmap數據結構的。在內部hash表是一個桶數組,每個桶是一個指向鍵值對數組的指針。每個桶裡面可以保存8個元素。我們可以簡化成下麵的結構。

如果我們繼續插入一個元素,hash鍵返回相同的索引,則另一個元素也會插入相同的桶中。
http://image-1313007945.cos.ap-nanjing.myqcloud.com/image/1666339085.png

如果正常桶中的元素已滿,還有元素繼續往相同的索引插入的話,go會創建另一個包含8個元素的桶並將前一個桶指向他。
http://image-1313007945.cos.ap-nanjing.myqcloud.com/image/1666339098.png

所以當我們讀取、更新和刪除map元素時,Go 必須計算相應的數組索引。 然後 Go 依次遍歷所有鍵,直到找到提供的鍵。 因此,這三個操作的最壞情況時間複雜度為 O(p),其中 p 是桶中元素的總數(預設為一個桶,溢出時為多個桶)。

2、map初始化

首先我們先初始化一個包含3個元素的map:

m := map[string]int{
		"haha": 3,
		"hehe": 5,
		"hoho": 7,
	}

我們可能只需要遍歷2個桶就可以找到上面的所有元素。

但是當我們添加100萬個元素的時候,我們可能需要遍歷上千個桶去找到指定的元素。

為了應對元素的增長,map會選擇擴容,一般是當前桶數量增加一倍。那什麼時候會擴容呢?

  • 負載因數大於6.5
  • 溢出桶太多

當map擴容的時候,所有的鍵都會重新分配到新的桶。所以最壞情況下,插入元素有可能是O(n)。

我們知道,在使用切片時,如果我們預先知道要添加到切片的元素數量,我們可以用給定的大小或容量對其進行初始化。這避免了不斷應對切片增長導致底層數組頻繁複制的問題。map與此類似。實際上,我們可以使用 make 內置函數在創建地圖時提供初始大小。例如,如果我們要初始化一個包含 100 萬個元素的map,可以這樣寫:

m := make(map[string]int, 1000000)

通過指定大小,go使用適當數量的桶創建map以存儲 100 萬個元素。 這節省了大量計算時間,因為map不用動態創建桶並處理桶溢出後rehash的問題。

指定大小 n 並不是說創建最多有100萬個元素的map。 我們可以繼續往map添加元素。 這實際代表著 Go 運行時至少 需要為n 個元素分配記憶體。

我們可以運行下基準測試看下這兩個的性能差異:

package main

import (
	"testing"
)

var n = 1000000

func BenchmarkWithSize(b *testing.B) {
	for i := 0; i < b.N; i++ {
		m := make(map[string]int, n)
		for j := 0; j < n; j++ {
			m["hhs" + string(rune(j))] = j
		}
	}
}

func BenchmarkWithoutSize(b *testing.B) {
	for i := 0; i < b.N; i++ {
		m := make(map[string]int)
		for j := 0; j < n; j++ {
			m["hhs"+string(rune(j))] = j
		}
	}
}
go test -bench=.
goos: darwin
goarch: amd64
pkg: go-demo/5
cpu: Intel(R) Core(TM) i7-4770HQ CPU @ 2.20GHz
BenchmarkWithSize-8                    6         178365104 ns/op
BenchmarkWithoutSize-8                 3         362949513 ns/op
PASS
ok      go-demo/5 4.563s

我們可以看到初始化map大小的性能是高於未設置初始化大小的性能。其中的原因上面應該解釋的很清楚了。

3、map記憶體泄漏

我們看下下麵的一個例子:

package main

import (
	"fmt"
	"runtime"
)

func main() {
	n := 1000000
	m := make(map[int]struct{})
	printAlloc()

	for i := 0; i < n; i++ {
		m[i] = struct{}{}
	}
	printAlloc()

	for i := 0; i < n; i++ {
		delete(m, i)
	}

	runtime.GC()
	printAlloc()
	// 保留對m的引用,確保map不會被回收
	runtime.KeepAlive(m)

}

// 列印記憶體分配情況
func printAlloc() {
	var m runtime.MemStats
	runtime.ReadMemStats(&m)
	fmt.Printf("%d MB\n", m.Alloc/1024/1024)
}
  1. 首先我們初始化一個map,map的值為空結構體,列印分配堆記憶體的大小。
  2. 接著我們往map中添加100萬個元素,列印分配堆記憶體的大小。
  3. 然後我們刪除所有元素,運行垃圾回收,列印分配堆記憶體的大小。

我們運行下上面的代碼:

go run 5.go
0 MB
33 MB
21 MB

當我們添加100萬元素之後,堆裡面會分配33M的數據,像下麵這樣
http://image-1313007945.cos.ap-nanjing.myqcloud.com/image/1666339207.png

當我們刪除100萬的數據之後,觸發GC回收,實際上GC只是回收了桶裡面的元素數據,桶的數量不會因為刪除操作而減少,所以還有21M的數據
http://image-1313007945.cos.ap-nanjing.myqcloud.com/image/1666339180.png

原因是map中的桶數不會縮小。

當然,為瞭解決大量寫入、刪除造成的記憶體泄漏問題,map引入了 sameSizeGrow 這一機制,在出現較多溢出桶時會整理哈希的記憶體減少空間的占用。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 數據類型轉換:將自身數據類型轉化成新的數據類型,並擁有新數據類型相關操作的過程; 為方便更好的幫助處理業務,將數據變更為更適合業務場景的類型; a = '1', 此時想使用數字的數學操作,就需要先將字元串轉化為數字類型; 1.數字與字元串間的轉換 # 字元串轉換成整數 a = '34' b = in ...
  • 為什麼要使用分頁 我們數據表中可能會有成千上萬條數據,當我們訪問某張表的所有數據時,我們不太可能需要一次把所有的數據都展示出來,因為數據量很大,對服務端的記憶體壓力比較大還有就是網路傳輸過程中耗時也會比較大。 通常我們會希望一部分一部分去請求數據,也就是我們常說的一頁一頁獲取數據並展示出來。 分頁的三 ...
  • member functions的調用方式 c++支持三種類型的member functions:static、nonstatic、virtual,且每一種調用方式不盡相同 nonstatic member functions nonstatic member function至少和nonmembe ...
  • 再談為了提醒明知故犯(在一坑裡迭倒兩次不是不多見),由於業務系統中大量使用了spring Boot embedded tomcat的模式運行,在一些運維腳本中經常看到Linux 中 kill 指令,然而它的使用也有些講究,要思考如何能做到優雅停機。 何為優雅關機 就是為確保應用關閉時,通知應用進程釋 ...
  • 1.什麼是dict 我們已經知道,list 和 tuple 可以用來表示順序集合,例如,班裡同學的名字: ['Adam', 'Lisa', 'Bart'] 或者考試的成績列表: [95, 85, 59] 但是,要根據名字找到對應的成績,用兩個 list 表示就不方便。 如果把名字和分數關聯起來,組成 ...
  • java(面向對象)的三大特性 封裝 ​ 是指隱藏對象的屬性和實現細節,僅對外提供公共訪問方式。 繼承 ​ 繼承是面向對象最顯著的一個特性。 繼承是從已有的類中派生出新的類, 新的類能吸收已有類的數據屬性和行為,並能擴展新的能力 多態 ​ 字面理解,就是多種形態,在Java中,多態指的是,一個類可以 ...
  • 性能優化說明:判斷數據表裡是否有數據,用limit 1/top 1取代求count 近期,數據中心系統負荷大,mysql伺服器的CPU動輒高達90%以上。代碼和數據表存在很大優化空間。 這裡分享一個定時同步數據的Job任務的優化過程。 先上代碼 public void executeJob(Stri ...
  • pygame簡介 pygame可以實現python游戲的一個基礎包。 pygame實現視窗 初始化pygame,init()類似於java類的初始化方法,用於pygame初始化。 pygame.init() 設置屏幕,(500,400)設置屏幕初始大小為500 * 400的大小, 0和32 是比較高 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...