協程併發下數據彙總:除了互斥鎖,還有其他方式嗎?

来源:https://www.cnblogs.com/chenjiazhan/archive/2023/05/21/17418276.html
-Advertisement-
Play Games

深入探討Python中的併發編程,特別關註多線程和多進程的應用。我們將先從基本概念開始,然後通過詳細舉例探討每一種機制,最後分享一些實戰經驗以及一種優雅的編程技巧。 ...


1. 簡介

本文介紹了在併發編程中數據彙總的問題,並探討了在併發環境下使用互斥鎖和通道兩種方式來保證數據安全性的方法。

首先,通過一個實例,描述了一個併發拉取數據並彙總的案例,並使用互斥鎖來確保線程安全。然後,討論了互斥鎖的一些缺點,引出了通道作為一種替代方案,並介紹了通道的基本使用和特性。接下來,通過實例演示瞭如何使用通道來實現併發下的數據彙總。

最後,引用了etcd中使用通道實現協程併發下數據彙總的例子,展示了通道在實際項目中的應用。

2. 問題引入

在請求處理過程中,經常需要通過RPC介面拉取數據。有時候,由於數據量較大,單個數據拉取操作可能會導致整個請求的處理時間較長。為了加快處理速度,我們通常考慮同時開啟多個協程併發地拉取數據。一旦多個協程併發拉取數據後,主協程需要彙總這些協程拉取到的數據,然後再返回結果。在這個過程中,往往涉及對共用資源的併發訪問,為了保證線程安全性,通常會使用互斥鎖。下麵通過一個簡單的代碼來展示該過程:

package main

import (
        "fmt"
        "sync"
        "time"
)

type Data struct {
        ID   int
        Name string
}

var (
        // 彙總結果
        dataList []Data
        // 互斥鎖
        mutex    sync.Mutex
)

func fetchData(page int, wg *sync.WaitGroup) {
        // 模擬RPC介面拉取數據的耗時操作
        time.Sleep(time.Second)

        // 假設從RPC介面獲取到了一批數據
        data := Data{
                ID:   page,
                Name: fmt.Sprintf("Data %d", page),
        }

        // 使用互斥鎖保護共用數據的併發訪問
        mutex.Lock()
        defer mutext.Unlock()
        dataList = append(dataList, data)

        wg.Done()
}

func main() {
        var wg sync.WaitGroup

        // 定義需要拉取的數據頁數
        numPages := 10

        // 啟動多個協程併發地拉取數據
        for i := 1; i <= numPages; i++ {
            wg.Add(1)
            go fetchData(i, &wg)
        }

        // 等待所有協程完成
        wg.Wait()

        // 列印拉取到的數據
        fmt.Println("Fetched data:")
        for _, data := range dataList {
            fmt.Printf("ID: %d, Name: %s\n", data.ID, data.Name)
        }
}

在上述示例中,我們定義了一個共用的dataList切片用於保存拉取到的數據。每個goroutine通過調用fetchData函數來模擬拉取數據的過程,並使用互斥鎖mutex保護dataList的併發訪問。主協程使用sync.WaitGroup等待所有協程完成數據拉取任務,然後列印出拉取到的數據。通過併發地拉取數據,並使用互斥鎖保證線程安全,我們可以顯著提高數據拉取的速度,並且確保數據的正確性和一致性。

回看上述實現,其實是涉及到了多個協程操作同一份數據,有可能導致線程安全的問題,然後這裡是通過互斥鎖來保證線程安全的。確實,使用互斥鎖是可以保證線程安全的,但是也是存在一些缺點的,比如競爭和阻塞,兩個協程同時競爭互斥鎖時,只有一個協程能夠獲得鎖,而其他協程則會被阻塞,這個就可能導致性能瓶頸,當然在這個場景下問題不大。其次就是代碼的複雜性提高了,使用互斥鎖需要仔細設計和管理,確保鎖的正確獲取和釋放。這增加了代碼的複雜性和維護成本,如果在代碼中處理鎖的方式不正確,可能會死鎖,導致程式無法繼續執行。

那我們其實就有疑問,在協程併發下數據彙總的場景,是否存在其他方式,不需要通過使用互斥鎖,也能夠保證線程安全呢? 其實還真有,Go語言中的channel非常適用於這種情況。通過使用通道,我們可以實現線程安全的數據共用和同步,而無需顯式地使用互斥鎖。下麵我們來瞭解一下channel

3. channel的使用

3.1 channel的基本介紹

3.1.1 基本說明

channel在Go語言中是一種特殊的數據結構,用於協程之間的通信和同步。它類似於一個先進先出(FIFO)的隊列,用於數據的傳輸和共用。在併發環境中,可以將數據發送到通道,也可以從通道中接收數據,而這兩個操作都是線程安全的。

使用channel的優勢在於它提供了內置的同步機制,無需顯式地使用互斥鎖來處理併發訪問。

當一個協程向通道發送數據時,如果通道已滿,發送操作會被阻塞,直到有其他協程從通道中接收數據釋放空間。同樣地,當一個協程從通道接收數據時,如果通道為空,接收操作也會被阻塞,直到有其他協程向通道發送數據。

同時,當多個協程同時訪問通道時,Go運行時系統會自動處理協程之間的同步和併發訪問的細節,保證數據的正確性和一致性。從而可以放心地在多個協程中使用通道進行數據的發送和接收操作,而不需要額外的鎖或同步機制來保證線程安全。

因此,使用channel其實是可以避免常見的併發問題,如競態條件和死鎖,簡化了併發編程的複雜性。

3.1.2 基本使用

通過上面對channel的基本介紹,我們已經對channel有了基本的瞭解,其實可以粗略理解其為一個併發安全的隊列。下麵來瞭解下channel的基本語法,從而能夠開始使用channel

channel基本操作分為創建channel,發送數據到channel,接收channel中的數據,以及關閉channel。下麵對其進行簡單展示:

創建channel,使用make函數創建通道,通道的類型可以根據需要選擇,例如intstring等:

ch := make(chan int)

發送數據到channel:使用<-操作符將數據發送到通道中

ch <- data

接收channel中的數據: 使用<-操作符從通道中接收數據

result := <-ch

關閉channel, 使用close函數關閉通道。關閉通道後,仍然可以從通道接收數據,但無法再向通道發送數據

close(ch)

通過上面channel的四個基本操作,便能夠實現在不同協程間線程安全得傳遞數據。最後通過一個例子,完整得展示channel的基本使用。

package main

import "fmt"

func main() {
        ch := make(chan string) // 創建字元串通道
        defer close(ch)
        go func() {
                ch <- "hello, channel!" // 發送數據到通道
        }()

        result := <-ch // 從通道接收數據
        fmt.Println(result)
}

在這個示例中,我們創建了一個字元串通道ch。然後,在一個單獨的協程中,我們向通道發送了字元串"hello, channel!"。最後,主協程從通道中接收數據,並將其列印出來。

通過使用通道,我們可以實現協程之間的數據傳輸和同步,確保數據的安全共用和線程安全性。通道的使用能夠簡化併發編程的複雜性,提供一種高效、可靠的方式來處理併發場景下的數據傳遞。

3.2 使用channel實現彙總數據

下麵,我們使用channel來實現併發數據彙總,替換掉之前使用互斥鎖來保證線程安全的實現:

package main

import (
        "fmt"
        "sync"
        "time"
)

type Data struct {
        ID   int
        Name string
}

func fetchData(page int, ch chan Data, wg *sync.WaitGroup) {
        // 模擬 RPC 介面拉取數據的耗時操作
        time.Sleep(time.Second)

        // 假設從 RPC 介面獲取到了一批數據
        data := Data{
                ID:   page,
                Name: fmt.Sprintf("Data %d", page),
        }

        ch <- data // 將數據發送到通道

        wg.Done()
}

func main() {
        var wg sync.WaitGroup

        // 定義需要拉取的數據頁數
        numPages := 10

        dataCh := make(chan Data, 10) // 創建用於接收數據的通道

        // 啟動多個協程併發地拉取數據
        for i := 1; i <= numPages; i++ {
                wg.Add(1)
                go fetchData(i, dataCh, &wg)
        }

        go func() {
                wg.Wait()
                close(dataCh) // 關閉通道,表示數據已經全部發送完成
        }()

        // 從通道接收數據並彙總
        var dataList []Data
        for data := range dataCh {
            dataList = append(dataList, data)
        }

        // 列印拉取到的數據
        fmt.Println("Fetched data:")
        for _, data := range dataList {
                fmt.Printf("ID: %d, Name: %s\n", data.ID, data.Name)
        }
}

在修改後的代碼中,我們創建了一個用於接收數據的 dataCh。每個協程通過將數據發送到該channel 來完成數據的彙總。主協程通過從channel接收數據,並將其添加到 dataList 中實現數據的彙總過程。這種方式不需要顯式地加鎖和解鎖,並且避免了互斥鎖帶來的複雜性和性能問題。

通過使用channel,我們能夠以一種更直觀、更安全的方式實現協程之間的數據傳遞和同步。channel在併發編程中起到了關鍵的作用,簡化了併發操作的管理和實現。同時,它提供了內置的同步機制,保證了數據的正確性和一致性,避免了死鎖和競態條件的問題。

3.3 總結

協程間的併發下彙總數據可以歸類為協程間的數據傳遞這個場景。在這個場景中,多個協程併發地拉取數據,然後將數據彙總到一個共用的數據結構中。為了保證數據的正確性和一致性,需要使用某種機制來確保多個協程對共用數據的併發訪問是安全的。

在原始的實現中,使用了互斥鎖來保護共用數據的併發訪問。互斥鎖提供了互斥訪問的機制,確保同一時間只有一個協程可以訪問共用數據,從而避免了數據競爭和不一致性。這種方式在保證線程安全的同時,引入了鎖的開銷和複雜性。

而使用channel來實現協程間的安全數據傳遞可以更簡潔和高效。每個協程可以將拉取到的數據通過channel發送到主協程,主協程通過接收channel中的數據來進行彙總。channel提供了併發安全的數據傳遞機制,協程之間的數據傳輸是同步和有序的。由於channel本身就提供了同步機制,不需要額外的鎖和同步操作,能夠更簡潔地實現協程間的安全數據傳遞。

因此,如果需要在多個協程間實現數據傳遞,而且由此可能帶來線程安全的問題,此時使用channel來實現是相對比較合適的。

4. 開源項目中的使用

假設我們需要對etcd進行性能測試,此時需要模擬大量併發請求,對etcd進行負載測試,並收集每個請求的執行時間、成功/失敗狀態等結果數據。然後主協程需要收集每一個請求的結果數據,併進行統計計算,生成相應的性能報告。基於此,能夠計算出總請求數、請求成功率、平均執行時間、最慢/最快請求等統計信息,以及錯誤分佈情況和慢速請求的詳細信息。

從上面的講述來看,其實我們可以大概想象出這個模型,多個協程併發執行,然後獲取每個請求的結果數據。然後主協程需要收集彙總這些數據,基於此來生成性能報告。這個模型其實也就是我們上面所說的協程併發下的數據彙總,因此通過channel來實現協程間的數據傳輸,是非常合適的。

下麵我們來看看etcd中對應的實現。etcd中存在一個report對象的實現,能夠接受一系列的請求數據的結果,然後生成性能報告返回回去。結構體定義如下:

type report struct {
   results   chan Result
   stats Stats
}
func (r *report) Results() chan<- Result { return r.results }

// Result describes the timings for an operation.
type Result struct {
   Start  time.Time
   End    time.Time
   Err    error
}

func newReport(precision string) *report {
   r := &report{
      results:   make(chan Result, 16),
   }
   return r
}

Result結構體為單個測試的結果,而 report 結構體則用於整個測試過程的報告和統計信息。通過使用 results 通道,可以將每個測試的結果發送到 report 結構體中,以便進行統計和生成報告。

當進行性能壓測時,首先通過newReport生成一個report對象,然後啟動多個協程同時進行壓測請求,每一個請求處理完成之後,便會生成一個處理結果,存儲到Result對象當中。然後基於report對象的Results方法獲取到對應的channel,將處理結果傳輸給主協程。

主協程便通過遍歷report對象中的results變數對應的channel,彙總計算所有處理結果,基於此便能夠生成壓測結果和報告。下麵來看其具體流程。

首先是創建一個report對象,然後啟動多個協程來處理請求,將結果發送到report對象中的results對應的channel中。

// 這裡NewReportSample方法,其實是對上面newReport方法的一個封裝
r := NewReportSample("%f")
// 這裡假設只有一個協程,模擬執行一系列的測試,並將測試結果發送到 Report 對象的 results 通道中。
go func() {
   start := time.Now()
   for i := 0; i < 5; i++ {
      // 不真實進行請求,只是簡單獲取執行結果,將測試結果進行傳輸
      end := start.Add(time.Second)
      r.Results() <- Result{Start: start, End: end}
      start = end
   }
   r.Results() <- Result{Start: start, End: start.Add(time.Second), Err: fmt.Errorf("oops")}
   // 假設所有壓測請求都執行完成了
   close(r.Results())
}()
// 主協程 彙總所有的處理結果,然後生成壓測報告
stats := <-r.Stats()

以上代碼中,r 是通過 NewReportSample("%f") 創建的一個 Report 對象。然後,在一個單獨的協程中,執行了一系列的測試,並將測試結果發送到 r.Results() 通道中。

這段代碼的作用是模擬執行一系列的測試,並將測試結果發送到 Report 對象的 results 通道中。通過使用 r.Results() 方法返回的通道,可以將測試結果發送到報告對象中進行統計和處理。

接下來,主協程應該不斷從 r.Results()方法返回的通道中讀取數據,彙總所有的處理結果,從而生成壓測報告。這個方法其實是被封裝在r.Stas()方法中,具體如下:

func (r *report) Stats() <-chan Stats {
    // 創建一個channel
   donec := make(chan Stats, 1)
   // 啟動一個協程來執行
   go func() {
      defer close(donec)
      r.processResults()
      s := r.stats.copy()
      if r.sps != nil {
         s.TimeSeries = r.sps.getTimeSeries()
      }
      // 執行完成的話,將結果返回
      donec <- s
   }()
   // 返回channel
   return donec
}

// Stats方法啟動的協程中,實際運行的任務
func (r *report) processResults() {
   st := time.Now()
   // 遍歷r.results方法中channel中的數據,然後執行處理流程
   for res := range r.results {
      r.processResult(&res)
   }
   // 後續執行一些具體的計算邏輯
}

上述代碼是 report 結構體中的兩個方法,其中 Stats() 方法返回一個只讀的 Stats 通道。這個方法會在一個單獨的協程中執行,並處理 results 通道中的測試結果。事實上就是彙總channel中的數據,然後進行一定的處理,然後返回。

5. 總結

本文通過介紹併發編程中的數據彙總問題,提出了使用互斥鎖和通道來保證線程安全的方法。互斥鎖適用於臨界區保護和共用資源的互斥訪問,但可能存在死鎖和性能瓶頸的問題。相比之下,通道提供了更直觀和安全的協程間通信方式,避免了鎖的問題,並提供了更靈活的併發模式。

基於以上內容的介紹,大概能夠明確下,在數據傳遞和彙總的場景下,使用channel來實現可能是更為合適的,能夠提高代碼的可讀性和併發安全性。希望以上內容對你有所幫助。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • # 使用 Async Rust 構建簡單的 P2P 節點 ### P2P 簡介 - P2P:peer-to-peer - P2P 是一種網路技術,可以在不同的電腦之間共用各種計算資源,如 CPU、網路帶寬和存儲。 - P2P 是當今用戶線上共用文件(如音樂、圖像和其他數字媒體)的一種非常常用的方法 ...
  • ## 1.1 為什麼要學 Qt Qt是一個跨平臺的 C++ 圖形用戶界面應用程式框架 Qt 為應用程式開發者提供建立藝術級圖形界面所需的所有功能 Qt 是完全面向對象的,很容易擴展,並且允許真正的組件編程 (1)Qt 發展史 在講解學習 Qt 的必要性之前, 先來瞭解下 Qt 的發展歷史: 1991 ...
  • 用go設計開發一個自己的輕量級登錄庫/框架吧(拓展篇),給自己的庫/框架拓展一下吧,主庫:https://github.com/weloe/token-go ...
  • ### 1.0 匿名對象的基本知識 * 匿名對象 顧名思義,匿名對象指的就是沒有名字的對象,在使用中理解為實例化一個類對象,但是並不把它賦給一個對應的類變數,而是直接使用。在理解匿名對象前,我們先創建一個類便於後面的使用。 * 匿名對象具有以下特征: 語法上:只創建對象,但不用變數來接收,例如:假設 ...
  • Groovy是一種基於Java平臺的動態編程語言,它結合了Python、Ruby和Smalltalk等語言的特性,同時與Java無縫集成。 ...
  • 從 JDK7 開始,引入了表示非同步通道的 `AsynchronousSockerChannel` 類和 `AsynchronousServerSocketChannel` 類,這兩個類的作用與 `SocketChannel` 類和 `ServerSockelChannel` 相似,區別在於非同步通道的 ...
  • ## 文章首發 [【重學C++】02 脫離指針陷阱:深入淺出 C++ 智能指針](https://mp.weixin.qq.com/s/McD-kfsiQ7hW1UnsAriC1g) ## 前言 大家好,今天是【重學C++】系列的第二講,我們來聊聊C++的智能指針。 ## 為什麼需要智能指針 在上一 ...
  • CAS 是樂觀鎖設計思想的實現。CAS 的思想是:在“讀取 - 修改 - 寫回”操作序列中,先讀取並修改數據,寫回數據前先判斷讀取數據後的這段時間內數據是否發生變化(共用變數的當前值是否是我們的期望值)。通過 CAS 我們可以以無鎖的方式,保證對共用數據進行 “讀取 - 修改 - 寫回” 操作序列的... ...
一周排行
    -Advertisement-
    Play Games
  • 一個自定義WPF窗體的解決方案,借鑒了呂毅老師的WPF製作高性能的透明背景的異形視窗一文,併在此基礎上增加了滑鼠穿透的功能。可以使得透明窗體的滑鼠事件穿透到下層,在下層窗體中響應。 ...
  • 在C#中使用RabbitMQ做個簡單的發送郵件小項目 前言 好久沒有做項目了,這次做一個發送郵件的小項目。發郵件是一個比較耗時的操作,之前在我的個人博客裡面回覆評論和友鏈申請是會通過發送郵件來通知對方的,不過當時只是簡單的進行了非同步操作。 那麼這次來使用RabbitMQ去統一發送郵件,我的想法是通過 ...
  • 當你使用Edge等瀏覽器或系統軟體播放媒體時,Windows控制中心就會出現相應的媒體信息以及控制播放的功能,如圖。 SMTC (SystemMediaTransportControls) 是一個Windows App SDK (舊為UWP) 中提供的一個API,用於與系統媒體交互。接入SMTC的好 ...
  • 最近在微軟商店,官方上架了新款Win11風格的WPF版UI框架【WPF Gallery Preview 1.0.0.0】,這款應用引入了前沿的Fluent Design UI設計,為用戶帶來全新的視覺體驗。 ...
  • 1.簡單使用實例 1.1 添加log4net.dll的引用。 在NuGet程式包中搜索log4net並添加,此次我所用版本為2.0.17。如下圖: 1.2 添加配置文件 右鍵項目,添加新建項,搜索選擇應用程式配置文件,命名為log4net.config,步驟如下圖: 1.2.1 log4net.co ...
  • 之前也分享過 Swashbuckle.AspNetCore 的使用,不過版本比較老了,本次演示用的示例版本為 .net core 8.0,從安裝使用開始,到根據命名空間分組顯示,十分的有用 ...
  • 在 Visual Studio 中,至少可以創建三種不同類型的類庫: 類庫(.NET Framework) 類庫(.NET 標準) 類庫 (.NET Core) 雖然第一種是我們多年來一直在使用的,但一直感到困惑的一個主要問題是何時使用 .NET Standard 和 .NET Core 類庫類型。 ...
  • WPF的按鈕提供了Template模板,可以通過修改Template模板中的內容對按鈕的樣式進行自定義。結合資源字典,可以將自定義資源在xaml視窗、自定義控制項或者整個App當中調用 ...
  • 實現了一個支持長短按得按鈕組件,單擊可以觸發Click事件,長按可以觸發LongPressed事件,長按鬆開時觸發LongClick事件。還可以和自定義外觀相結合,實現自定義的按鈕外形。 ...
  • 一、WTM是什麼 WalkingTec.Mvvm框架(簡稱WTM)最早開發與2013年,基於Asp.net MVC3 和 最早的Entity Framework, 當初主要是為瞭解決公司內部開發效率低,代碼風格不統一的問題。2017年9月,將代碼移植到了.Net Core上,併進行了深度優化和重構, ...