關於EF Core 更新速度隨時間越來越慢的解決辦法

来源:https://www.cnblogs.com/msdeveloper/archive/2023/06/26/17435661.html
-Advertisement-
Play Games

# 關於EF Core更新速度隨時間越來越慢的解決辦法 ## 概要 本篇主要介紹使用 `context.ChangeTracker.Clear() `方法,在通過迴圈進行批量更新時,通過手動清除跟蹤實體以提高性能的示例。 ## 背景 最近在做一些數據分析時,遇到了一個問題,當我把計算結果更新到資料庫 ...


關於EF Core更新速度隨時間越來越慢的解決辦法

概要

本篇主要介紹使用 context.ChangeTracker.Clear() 方法,在通過迴圈進行批量更新時,通過手動清除跟蹤實體以提高性能的示例。

背景

最近在做一些數據分析時,遇到了一個問題,當我把計算結果更新到資料庫時,一開始速度會很快,但隨著時間的推移,更新速度會越來越慢。
本篇博客就來說明這種現象的原因和解決辦法。

環境:ASP.NET Core 7EF Core 7.

事例說明

我有1000W已處理好的數據需要更新到資料庫,這些數據我也是從資料庫中一次性查詢出來的,這樣可以只進行一次查詢,並使用AsNoTracking()提高查詢效率,然後我對這些數據進行了並行計算,最後將計算完的結果更新到資料庫。最費時的操作就是更新到資料庫。

請看以下代碼示例:

var bc = new ConcurrentBag<List<StockDailyKLineInfo>>();
// 並行計算
var computeTasks = group.AsParallel()
    .WithDegreeOfParallelism(Environment.ProcessorCount)
    .WithExecutionMode(ParallelExecutionMode.ForceParallelism)
    .Select(async g =>
    {
        var computedData = await service.ComputeAsync(g.ToList());
        if (computedData != null)
        {
            bc.Add(computedData);
        }
    });

await Task.WhenAll(computeTasks);

// 數據插入
var batchSize = 5000;
var items = bc.SelectMany(x => x).ToList();
left = items.Count;
_logger.LogInformation($"need update {left} daily!");

foreach (var batch in items.Chunk(batchSize))
{
    context.AttachRange(batch);
    foreach (var entity in batch)
    {
        var entry = context.Entry(entity);
        entry.Property(e => e.A).IsModified = true;
        entry.Property(e => e.B).IsModified = true;
        entry.Property(e => e.C).IsModified = true;
        entry.State = EntityState.Modified;
    }

    var count = await context.SaveChangesAsync();
}
await Console.Out.WriteLineAsync("[done] update all data");

並行計算速度非常快,幾秒就能都完成了。

數據插入,我分批進行迴圈插入,每次5000條,通常不到1秒時間就能插入成功。但隨著時間的推移,插入速度越來越慢。

[!NOTE]
由於我有1000W的數據插入,如果最終一次性提交,如果出現了異常,那麼所有數據都不會插入成功,並且會等待很長的時間,並且在最終執行完成之前,你得不到任何信息,以預估可能花費的時間。所以我需要分批插入。

原因

EF Core 會在上下文中跟蹤所有已載入或附加的實體。隨著迴圈的進行,上下文將追蹤越來越多的實體,這可能會導致性能下降。

也就是說在同一個DbContext上下文中,SaveChangesAsync()方法調用後,不會清除已更新的內容,這意味著追蹤的實體越來越多,最終多達1000W,並且這些都是已經標記為要更新的內容,也意味著你每次都會更新更多的內容到資料庫。

解決辦法

只進行一次SaveChanges

既然每次saveChanges不會清除,那麼最後我只提交一次不就行了麽?但這個方案不符合實際需求,上面已經提到過了。

使用多個DbContext

既然 同一個DbContext下會出現這個問題,那麼每次更新,我再創建一個新的DbContext不就可以了麽?
這個方法雖然可行,但對於1000W的數據來說,即使我每次更新1W條數據,也需要創建1000+次DbContext,也有一定的消耗。

清除追蹤

既然問題是SaveChanges不會自動清除已追蹤的更改,如果我可以手動去清除,不就可以了麽?清除的操作比起創建新的DbContext實例,還是更快捷的。

那麼我們修改代碼:

foreach (var batch in items.Chunk(batchSize))
{
    context.AttachRange(batch);
    foreach (var entity in batch)
    {
        var entry = context.Entry(entity);
        entry.Property(e => e.A).IsModified = true;
        entry.Property(e => e.B).IsModified = true;
        entry.Property(e => e.C).IsModified = true;
        entry.State = EntityState.Modified;
    }
    var count = await context.SaveChangesAsync();

    // ⚒️ add this line
    context.ChangeTracker.Clear();
}

[!TIP]
context.ChangeTracker.Clear() 方法清除上下文中的所有已跟蹤實體。這將重置更改跟蹤器並清除其跟蹤的所有實體,從而釋放記憶體並提高性能。

總結

EF Core 7 中已經添加了批量更新的方法,但這種方法也不適用於我遇到的場景,因為我不是按條件進行批量更新,而是每一條數據都需要更新。
context.ChangeTracker.Clear()可以在這樣的場景下發揮作用,在一些關聯插入或更新的場景,為避免追蹤帶來的衝突問題,也可以通過該方法清除追蹤,然後再手動建立關係,進行提交。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ### 序 上一篇我們介紹了 k8s 的基本架構,我們在這篇文章將介紹 `Kubernetes` 關鍵組件和概念。 還是先來一張圖: ![1_2pdatNn7KzcQZpc8cOALOQ.webp][1] 根據上圖我們分別對`Deployment`、`ReplicaSet`、`Pod`詳細的介紹,其 ...
  • ### 一、項目結構 新建報表微服務模塊,這是我的項目結構圖。 ![](https://pic.smartasc.cn/blogPics/20230626141851.png) ### 二、執行初始化數據腳本 運行積木報表的初始化腳本,創建相關表結構,github速度太慢,推薦使用 [gitee地址 ...
  • 1、準備需要的jar包並複製到伺服器某個目錄下 ![](https://img2023.cnblogs.com/blog/1928230/202306/1928230-20230626151543572-42173473.png) 2、在此目錄下,創建Dockerfile的文本文件,並將以下內容添加 ...
  • # hovertool `HoverTool` 是 `Bokeh` 庫中的一個工具,它可以在滑鼠懸停在圖上時顯示數據。當滑鼠指針放在圖表的特定部分(比如散點圖的點或者線圖中的線的時候),該工具會顯示與該部分相關的附加信息。 一般配套使用的是`from bokeh.plotting import fi ...
  • 最近在讀《數據密集型應用系統設計》,其中談到了zookeeper對容錯共識演算法的應用。這讓我想到之前參考的zookeeper學習資料中,誤將容錯共識演算法寫成了2PC(兩階段提交協議),所以準備以此文對共識演算法和2PC做梳理和區分,也希望它能幫助像我一樣對這兩者有誤解的同學。 ...
  • 上一篇介紹的**通用計算**是關於多個`numpy`數組的計算, 本篇介紹的**聚合計算**一般是針對單個數據集的各種統計結果,同樣,使用**聚合函數**,也可以避免繁瑣的迴圈語句的編寫。 # 元素的和 數組中的元素求和也就是合計值。 ## 調用方式 **聚合計算**有兩種調用方式,一種是面向對象的 ...
  • 主要介紹了WPF中的兩大類資源:應用資源和XAML 資源以及在使用資源時通過靜態資源引用和使用動態資源引用的區別,需要根據具體場景調整。 本文是學習WPF所作筆記,內容難免由紕漏,歡迎留言討論! ...
  • # 如何部署ASP.NET Core 到Linux伺服器 我們開發的最終目的,是將開發後的東西發佈網路上,以便自己及其他人使用。 本篇博客介紹如果在 linux 上部署 ASP.NET Core應用,使用nginx+systemd 來管理我們的應用。 ## 準備 - Ubuntu 20.04 - N ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...