使用MySqlBulkLoader批量插入數據

来源:https://www.cnblogs.com/yaoxiaodan/archive/2022/06/27/16416567.html
-Advertisement-
Play Games

最近在項目中遇到插入數據瓶頸,幾萬、幾十萬、幾百萬的數據保存到MYSQL資料庫,使用EF插入數據速度非常慢,數據量非常大時EF插入需要幾十分鐘,甚至幾個小時,這樣子的速度肯定不是我們所期望的。 後面經過瞭解與研究發現MySqlBulkLoader,可以批量將數據插入到資料庫並且速度上面遠遠優於EF。 ...


 

最近在項目中遇到插入數據瓶頸,幾萬、幾十萬、幾百萬的數據保存到MYSQL資料庫,使用EF插入數據速度非常慢,數據量非常大時EF插入需要幾十分鐘,甚至幾個小時,這樣子的速度肯定不是我們所期望的。

後面經過瞭解與研究發現MySqlBulkLoader,可以批量將數據插入到資料庫並且速度上面遠遠優於EF。

MySqlBulkLoader主要的實現方式:將需要插入的數據轉成DataTable,DataTable轉成一個CSV文件,將CSV文件使用批量導入的形式導入到資料庫裡面去。

 

註意:

1).資料庫連接地址需要添加配置AllowLoadLocalInfile=true,允許本地文件導入;

Data Source = 資料庫地址; Port = 埠; Initial Catalog = 資料庫名; User Id = 用戶名; Password = 密碼;AllowLoadLocalInfile=true;

2).插入的時候會返回插入行數,但是檢查所有的數據都正確,也沒有報異常,卻返回了插入數量為0,可以檢查表是否有唯一索引,插入的數據是否違反了唯一索引

(以下分塊展示了代碼,如果需要看完整的代碼直接看 5.完整的代碼) 

 

1.將List轉化為DataTable 

   /// <summary>
        /// 將List轉化為DataTable
        /// </summary>
        /// <returns></returns>
        public DataTable ListToDataTable<T>(List<T> data)
        {
            #region 創建一個DataTable,以實體名稱作為DataTable名稱

            var tableName = typeof(T).Name;
            tableName = tableName.ToSnakeCase(); /*實體名稱與表名進行轉化,主要根據各項目的規定進行轉化,不一定就是我這些寫的這種轉換方式*/
            DataTable dt = new DataTable
            {
                TableName = tableName
            };

            #endregion

            #region 拿取列名,以實體的屬性名作為列名       

            var properties = typeof(T).GetProperties();
            foreach (var item in properties)
            {
                var curFileName = item.Name;
                curFileName = curFileName.ToSnakeCase();/*列名與欄位名進行轉化,主要根據各項目的規定進行轉化,不一定就是我這些寫的這種轉換方式*/
                dt.Columns.Add(curFileName);
            }

            #endregion

            #region 列賦值
            foreach (var item in data)
            {
                DataRow dr = dt.NewRow();
                var columns = dt.Columns;

                var curPropertyList = item.GetType().GetProperties();
                foreach (var p in curPropertyList)
                {
                    var name = p.Name;
                    name = name.ToSnakeCase();/*列名與欄位名進行轉化,主要根據各項目的規定進行轉化,不一定就是我這些寫的這種轉換方式*/
                    var curValue = p.GetValue(item);

                    int i = columns.IndexOf(name);
                    dr[i] = curValue;
                }

                dt.Rows.Add(dr);
            }

            #endregion  

            return dt;
        }

  

2.將DataTable轉換為標準的CSV文件 

  /// <summary>
    /// csv擴展
    /// </summary>
    public static class CSVEx
    {
        /// <summary>
        ///將DataTable轉換為標準的CSV文件
        /// </summary>
        /// <param name="table">數據表</param>
        /// <param name="tmpPath">文件地址</param>
        /// <returns>返回標準的CSV</returns>
        public static void ToCsv(this DataTable table, string tmpPath)
        {
            //以半形逗號(即,)作分隔符,列為空也要表達其存在。
            //列內容如存在半形逗號(即,)則用半形引號(即"")將該欄位值包含起來。
            //列內容如存在半形引號(即")則應替換成半形雙引號("")轉義,並用半形引號(即"")將該欄位值包含起來。
            StringBuilder sb = new StringBuilder();
            DataColumn colum;
            foreach (DataRow row in table.Rows)
            {
                for (int i = 0; i < table.Columns.Count; i++)
                {
                    Type _datatype = typeof(DateTime);
                    colum = table.Columns[i];
                    if (i != 0) sb.Append("\t");
                    //if (colum.DataType == typeof(string) && row[colum].ToString().Contains(","))
                    //{
                    //    sb.Append("\"" + row[colum].ToString().Replace("\"", "\"\"") + "\"");
                    //}
                    if (colum.DataType == _datatype)
                    {
                        sb.Append(((DateTime)row[colum]).ToString("yyyy/MM/dd HH:mm:ss"));
                    }
                    else sb.Append(row[colum].ToString());
                }
                sb.Append("\r\n");
            }
            StreamWriter sw = new StreamWriter(tmpPath, false, UTF8Encoding.UTF8);
            sw.Write(sb.ToString());
            sw.Close();
        }

    }

 

3.CSV文件導入數據到資料庫

    /// <summary>
    /// 批量導入mysql幫助類
    /// </summary>
    public static class MySqlHelper
    {
        /// <summary>
        /// MySqlBulkLoader批量導入
        /// </summary>
        /// <param name="_mySqlConnection">資料庫連接地址</param>
        /// <param name="table"></param>
        /// <param name="csvName"></param>
        /// <returns></returns>
        public static int BulkLoad(MySqlConnection _mySqlConnection, DataTable table, string csvName)
        {
            var columns = table.Columns.Cast<DataColumn>().Select(colum => colum.ColumnName).ToList();
            MySqlBulkLoader bulk = new MySqlBulkLoader(_mySqlConnection)
            {
                FieldTerminator = "\t",
                FieldQuotationCharacter = '"',
                EscapeCharacter = '"',
                LineTerminator = "\r\n",
                FileName = csvName,
                NumberOfLinesToSkip = 0,
                TableName = table.TableName,

            };

            bulk.Columns.AddRange(columns);
            return bulk.Load();
        }
    }

  

4.使用MySqlBulkLoader批量插入數據

        /// <summary>
        /// 使用MySqlBulkLoader批量插入數據
        /// </summary>
        /// <typeparam name="T"></typeparam>
        /// <param name="data"></param>
        /// <returns></returns>
        /// <exception cref="Exception"></exception>
        public int BulkLoaderData<T>(List<T> data)
        {
            if (data.Count <= 0) return 0;

            var connectString = "資料庫連接地址";
            using (MySqlConnection connection = new MySqlConnection(connectString))
            {
                MySqlTransaction sqlTransaction = null;
                try
                {
                    if (connection.State == ConnectionState.Closed)
                    {
                        connection.Open();
                    }
                    sqlTransaction = connection.BeginTransaction();


                    var dt = ListToDataTable<T>(data); //將List轉成dataTable
                    string tmpPath = Path.GetTempFileName();
                    dt.ToCsv(tmpPath); //將DataTable轉成CSV文件
                    var insertCount = MySqlHelper.BulkLoad(connection, dt, tmpPath); //使用MySqlBulkLoader插入數據
                    sqlTransaction.Commit();

                    try
                    {
                        if (File.Exists(tmpPath)) File.Delete(tmpPath);
                    }
                    catch (Exception)
                    {
                        //刪除文件失敗

                    }
                    return insertCount; //返回執行成功的條數
                }
                catch (Exception e)
                {
                    if (sqlTransaction != null)
                    {
                        sqlTransaction.Rollback();
                    }
                    //執行異常 
                    throw e;
                }
            }

        }

 

 5.完整的代碼:

namespace WebApplication1.BrantchInsert
{

    /// <summary>
    /// 批量插入
    /// </summary>
    public class BulkLoader
    {


        /// <summary>
        /// 測試批量插入入口
        /// </summary>
        /// <returns></returns>
        public int BrantchDataTest()
        {

            #region 模擬數據
            var data = new List<CrmCouponTestDto>() {
                 new CrmCouponTestDto {
                     Id=1,
                     CouponCode="test001",
                     CouponId = 1,
                     MemberId=100,
                     IssueTime=Convert.ToDateTime("2022-06-27 14:00:00"),
                     UsageTime=Convert.ToDateTime("3000-12-31 00:00:00"),
                     UsageShopId=0,
                     UsageBillNo="",
                     EffectiveStart=Convert.ToDateTime("2022-06-27 14:00:00"),
                     EffectiveEnd=Convert.ToDateTime("2023-06-27 14:00:00"),
                     Status=0
                 },
                 new CrmCouponTestDto {
                     Id=2,
                     CouponCode="test002",
                     CouponId = 1,
                       MemberId=101,
                     IssueTime=Convert.ToDateTime("2022-06-27 14:00:00"),
                     UsageTime=Convert.ToDateTime("2022-06-27 14:30:00"),
                     UsageShopId=2,
                     UsageBillNo="CS202206271430001",
                     EffectiveStart=Convert.ToDateTime("2022-06-27 14:00:00"),
                     EffectiveEnd=Convert.ToDateTime("2023-06-27 14:00:00"),
                     Status=1
                 },
                  new CrmCouponTestDto {
                     Id=3,
                     CouponCode="test003",
                     CouponId = 1,
                     MemberId=102,
                     IssueTime=Convert.ToDateTime("2022-06-27 14:00:00"),
                     UsageTime=Convert.ToDateTime("3000-12-31 00:00:00"),
                     UsageShopId=0,
                     UsageBillNo="",
                     EffectiveStart=Convert.ToDateTime("2022-06-27 14:00:00"),
                     EffectiveEnd=Convert.ToDateTime("2023-06-27 14:00:00"),
                     Status=0
                 },
                    new CrmCouponTestDto {
                     Id=4,
                     CouponCode="test004",
                     CouponId = 1,
                     MemberId=103,
                     IssueTime=Convert.ToDateTime("2022-06-27 14:00:00"),
                     UsageTime=Convert.ToDateTime("3000-12-31 00:00:00"),
                     UsageShopId=0,
                     UsageBillNo="",
                     EffectiveStart=Convert.ToDateTime("2022-06-27 14:00:00"),
                     EffectiveEnd=Convert.ToDateTime("2023-06-27 14:00:00"),
                     Status=0
                 }
             };
            #endregion
            var result = BulkLoaderData<CrmCouponTestDto>(data);
            return result;

        }


        /// <summary>
        /// 使用MySqlBulkLoader批量插入數據
        /// </summary>
        /// <typeparam name="T"></typeparam>
        /// <param name="data"></param>
        /// <returns></returns>
        /// <exception cref="Exception"></exception>
        public int BulkLoaderData<T>(List<T> data)
        {
            if (data.Count <= 0) return 0;

            var connectString = "資料庫連接地址";
            using (MySqlConnection connection = new MySqlConnection(connectString))
            {
                MySqlTransaction sqlTransaction = null;
                try
                {
                    if (connection.State == ConnectionState.Closed)
                    {
                        connection.Open();
                    }
                    sqlTransaction = connection.BeginTransaction();


                    var dt = ListToDataTable<T>(data); //將List轉成dataTable
                    string tmpPath = Path.GetTempFileName();
                    dt.ToCsv(tmpPath); //將DataTable轉成CSV文件
                    var insertCount = MySqlHelper.BulkLoad(connection, dt, tmpPath); //使用MySqlBulkLoader插入數據
                    sqlTransaction.Commit();

                    try
                    {
                        if (File.Exists(tmpPath)) File.Delete(tmpPath);
                    }
                    catch (Exception)
                    {
                        //刪除文件失敗

                    }
                    return insertCount; //返回執行成功的條數
                }
                catch (Exception e)
                {
                    if (sqlTransaction != null)
                    {
                        sqlTransaction.Rollback();
                    }
                    //執行異常 
                    throw e;
                }
            }

        }


        /// <summary>
        /// 將List轉化為DataTable核心方法
        /// </summary>
        /// <returns></returns>
        public DataTable ListToDataTable<T>(List<T> data)
        {
            #region 創建一個DataTable,以實體名稱作為DataTable名稱

            var tableName = typeof(T).Name;
            tableName = tableName.ToSnakeCase(); /*實體名稱與表名進行轉化,主要根據各項目的規定進行轉化,不一定就是我這些寫的這種轉換方式*/
            DataTable dt = new DataTable
            {
                TableName = tableName
            };

            #endregion

            #region 拿取列名,以實體的屬性名作為列名       

            var properties = typeof(T).GetProperties();
            foreach (var item in properties)
            {
                var curFileName = item.Name;
                curFileName = curFileName.ToSnakeCase();/*列名與欄位名進行轉化,主要根據各項目的規定進行轉化,不一定就是我這些寫的這種轉換方式*/
                dt.Columns.Add(curFileName);
            }

            #endregion

            #region 列賦值
            foreach (var item in data)
            {
                DataRow dr = dt.NewRow();
                var columns = dt.Columns;

                var curPropertyList = item.GetType().GetProperties();
                foreach (var p in curPropertyList)
                {
                    var name = p.Name;
                    name = name.ToSnakeCase();/*列名與欄位名進行轉化,主要根據各項目的規定進行轉化,不一定就是我這些寫的這種轉換方式*/
                    var curValue = p.GetValue(item);

                    int i = columns.IndexOf(name);
                    dr[i] = curValue;
                }

                dt.Rows.Add(dr);
            }

            #endregion  

            return dt;
        }


    }


    /// <summary>
    /// 批量導入mysql幫助類
    /// </summary>
    public static class MySqlHelper
    {
        /// <summary>
        /// MySqlBulkLoader批量導入
        /// </summary>
        /// <param name="_mySqlConnection">資料庫連接地址</param>
        /// <param name="table"></param>
        /// <param name="csvName"></param>
        /// <returns></returns>
        public static int BulkLoad(MySqlConnection _mySqlConnection, DataTable table, string csvName)
        {
            var columns = table.Columns.Cast<DataColumn>().Select(colum => colum.ColumnName).ToList();
            MySqlBulkLoader bulk = new MySqlBulkLoader(_mySqlConnection)
            {
                FieldTerminator = "\t",
                FieldQuotationCharacter = '"',
                EscapeCharacter = '"',
                LineTerminator = "\r\n",
                FileName = csvName,
                NumberOfLinesToSkip = 0,
                TableName = table.TableName,

            };

            bulk.Columns.AddRange(columns);
            return bulk.Load();
        }
    }


    /// <summary>
    /// csv擴展
    /// </summary>
    public static class CSVEx
    {
        /// <summary>
        ///將DataTable轉換為標準的CSV文件
        /// </summary>
        /// <param name="table">數據表</param>
        /// <param name="tmpPath">文件地址</param>
        /// <returns>返回標準的CSV</returns>
        public static void ToCsv(this DataTable table, string tmpPath)
        {
            //以半形逗號(即,)作分隔符,列為空也要表達其存在。
            //列內容如存在半形逗號(即,)則用半形引號(即"")將該欄位值包含起來。
            //列內容如存在半形引號(即")則應替換成半形雙引號("")轉義,並用半形引號(即"")將該欄位值包含起來。
            StringBuilder sb = new StringBuilder();
            DataColumn colum;
            foreach (DataRow row in table.Rows)
            {
                for (int i = 0; i < table.Columns.Count; i++)
                {
                    Type _datatype = typeof(DateTime);
                    colum = table.Columns[i];
                    if (i != 0) sb.Append("\t");
                    //if (colum.DataType == typeof(string) && row[colum].ToString().Contains(","))
                    //{
                    //    sb.Append("\"" + row[colum].ToString().Replace("\"", "\"\"") + "\"");
                    //}
                    if (colum.DataType == _datatype)
                    {
                        sb.Append(((DateTime)row[colum]).ToString("yyyy/MM/dd HH:mm:ss"));
                    }
                    else sb.Append(row[colum].ToString());
                }
                sb.Append("\r\n");
            }
            StreamWriter sw = new StreamWriter(tmpPath, false, UTF8Encoding.UTF8);
            sw.Write(sb.ToString());
            sw.Close();
        }

    }

    /// <summary>
    /// 字元串轉化
    /// </summary>
    public static class StringExtensions
    {
        /// <summary>
        /// 轉換為 main_keys_id 這種形式的字元串方式
        /// </summary>
        public static string ToSnakeCase(this string input)
        {
            if (string.IsNullOrEmpty(input)) { return input; }

            var startUnderscores = Regex.Match(input, @"^_+");
            return startUnderscores + Regex.Replace(input, @"([a-z0-9])([A-Z])", "$1_$2").ToLower();
        }
    }


    /// <summary>
    /// 實體
    /// </summary>
    public class CrmCouponTestDto
    {
        /// <summary>
        /// ID
        /// </summary>
        public long Id { get; set; }

        /// <summary>
        /// 卡券號
        /// </summary>     
        public string CouponCode { get; set; }

        /// <summary>
        /// 卡券ID
        /// </summary>
        public int CouponId { get; set; }

        /// <summary>
        /// 會員ID
        /// </summary>
        public int MemberId { get; set; }

        /// <summary>
        /// 發放時間
        /// </summary>   
        public DateTime IssueTime { get; set; }

        /// <summary>
        /// 使用時間
        /// </summary>      
        public DateTime UsageTime { get; set; }

        /// <summary>
        /// 使用店鋪ID
        /// </summary>      

        public int UsageShopId { get; set; }

        /// <summary>
        /// 使用單號
        /// </summary>      
        public string UsageBillNo { get; set; }

        /// <summary>
        /// 有效開始時間
        /// </summary>      
        public DateTime EffectiveStart { get; set; }

        /// <summary>
        /// 有效結束時間
        /// </summary>      
        public DateTime EffectiveEnd { get; set; }

        /// <summary>
        /// 狀態
        /// CouponStatus 卡券狀態:
        /// -1:未領用
        /// 0:未使用
        /// 1:已使用
        /// 2:已過期
        ///3:已作廢
        ///4:轉贈中
        /// </summary>

        public Int16 Status { get; set; }
    }
}

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • MySQL有兩個核心的知識點,索引和鎖。前幾篇文章已經詳細講解了MySQL索引實現機制,今天再一起學習一下MySQL的鎖。 ...
  • 使用Javafx插件的TreeTableView控制項,令一個類以樹狀表格的形式顯示。 ...
  • 我們都知道 Java 是一門一次編譯到處運行的語言,這與 JVM 有很大的關係,當我們執行 Java 程式的時候,會把一個一個的 .java 文件轉化成 JVM 可以理解的 class 文件,然後又 JVM 去執行,註意這裡的 JVM 是分操作系統的,所以可以做到一次編譯,到處運行。那麼Java 從 ...
  • <?php $function = @$_GET['f']; function filter($img){ $filter_arr = array('php','flag','php5','php4','fl1g'); $filter = '/'.implode('|',$filter_arr).' ...
  • 前言 微服務的服務提供者和服務消費者解耦合之後,我們可以藉助restTemplate這樣的HTTP客戶端,向微服務的服務提供者發起遠程調用; 但是這樣的代碼有2大缺陷: 代碼可讀性差,編程體驗不統一 當URL參數複雜時難以維護 //使用RestTemplate發起遠程調用 @Autowired pr ...
  • 增:添加數據 利用模型類創建對象來進行增加 語法: 對象名 = 模型類(欄位=值) 需要自己手動保存對象名.save() 利用模型類管理器增加數據 語法: 模型類.objects.create(欄位=值...) 刪:刪除數據 利用模型類創建對象進行刪除 語法: 對象名 = 模型類.objects.g ...
  • 今日目標: 1:能夠說出什麼是數據結構,什麼是演算法 2:能說出大O時間複雜度是怎麼得來的 3:能夠說出時間複雜度的幾個分析原則並加以實際應用 4:能夠說出常見的幾種時間複雜度O(1),O(n),O(log n),O(n * log n) 5:能理解空間複雜度的分析方式 1、概念 雖然概念很空洞,但是 ...
  • Homebrew,好用到爆!GitHub 星標 32.5k+的 macOS 命令行軟體管理神器,功能真心強大! ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...