MySql || 快速創建100w條記錄

来源:https://www.cnblogs.com/hill1126/archive/2019/08/11/11334523.html
-Advertisement-
Play Games

平時每個開發者都會討論數據量大時,sql的優化問題。但是並不是每個人都會有100w的數據量可以用來實戰,那麼今天我們就自己動手,模擬一個100w數據量的表。 創建原理 其實創建的方法有很多,有快的也有慢的。本博客中寫的當然不是最快的那個,但確實是比較好操作和理解的。那麼我先來說明一下它的原理:它是利 ...


平時每個開發者都會討論數據量大時,sql的優化問題。但是並不是每個人都會有100w的數據量可以用來實戰,那麼今天我們就自己動手,模擬一個100w數據量的表。

  • 創建原理

其實創建的方法有很多,有快的也有慢的。本博客中寫的當然不是最快的那個,但確實是比較好操作和理解的。那麼我先來說明一下它的原理:它是利用mysql中的在MEMORY引擎的特點,用於快速的插入100w的數據在記憶體中存放,然後再利用sql插入到目標的表當中。

  • 操作步驟
  1. 創建表t_user,這是用於存放數據的表。
 1 CREATE TABLE `t_user` (
 2   `id` int(11) NOT NULL AUTO_INCREMENT,
 3   `c_user_id` varchar(36) NOT NULL DEFAULT '',
 4   `c_name` varchar(22) NOT NULL DEFAULT '',
 5   `c_province_id` int(11) NOT NULL,
 6   `c_city_id` int(11) NOT NULL,
 7   `create_time` datetime NOT NULL,
 8   PRIMARY KEY (`id`) 9 ) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4;

  2.創建記憶體表t_user_memory,這是用於快速插入數據的表。

1 CREATE TABLE `t_user_memory` (
2   `id` int(11) NOT NULL AUTO_INCREMENT,
3   `c_user_id` varchar(36) NOT NULL DEFAULT '',
4   `c_name` varchar(22) NOT NULL DEFAULT '',
5   `c_province_id` int(11) NOT NULL,
6   `c_city_id` int(11) NOT NULL,
7   `create_time` datetime NOT NULL,
8   PRIMARY KEY (`id`)
9 ) ENGINE=MEMORY DEFAULT CHARSET=utf8mb4;

  3.創建隨機字元串函數randStr(),用於在給c_name賦值時更加隨機。

delimiter $$
CREATE DEFINER=`root`@`%` FUNCTION `randStr`(n INT) RETURNS varchar(255) CHARSET utf8mb4
DETERMINISTIC
BEGIN
 DECLARE chars_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
 DECLARE return_str varchar(255) DEFAULT '';
 DECLARE i INT DEFAULT 0;
 WHILE i<n DO
     SET return_str = concat(return_str, substring(chars_str, FLOOR(1 + RAND() * 62), 1));
        SET i=i+1;
END WHILE;
RETURN return_str;
END $$

這個函數的語法不用解釋也會看得懂,但是還是有幾個點需要註意的。

  1. delimiter關鍵字,這是一個聲明結束符的關鍵字。簡單的來說就是,防止和BEGIN和END之間的語句衝突,因為我們希望這裡面的語句是連續執行的。
  2. CONCAT(str,str)鏈接兩個字元串組成一個新的字元串。
  3. FLOOR(num)函數,向下取整。例如floor(1.23) = 1 、floor(-1.23) = -2。

 

  4.創建隨機時間函數randDataTime(),為了後期的時間更加隨機。

 1 delimiter $$
 2 CREATE DEFINER = `root`@`%` FUNCTION `randDataTime` (sd DATETIME, ed DATETIME) RETURNS datetime DETERMINISTIC
 3 BEGIN
 4     DECLARE
 5         sub INT DEFAULT 0 ; 
 6     DECLARE
 7             ret DATETIME ;
 8         SET sub = ABS(
 9             UNIX_TIMESTAMP(ed) - UNIX_TIMESTAMP(sd)
10         ) ;
11         SET ret = DATE_ADD(
12             sd,
13             INTERVAL FLOOR(1 + RAND() *(sub - 1)) SECOND
14         ) ; 
15     RETURN ret ; 
16 END $$

裡面的需要註意的是DATE_ADD(dateTime,INTERVAL  num  SECOND)函數,第一個參數是被添加的時間,第二個參數是一個組合,表明是添加的長度,如:(INTERVAL 1  YEAR)表示在原來的基礎上添加一年的時間間隔

  5.創建插入數據存儲過程add_t_user_memory (int)

 1 delimiter $$
 2 CREATE DEFINER=`root`@`%` PROCEDURE add_t_user_memory (IN n INT)
 3 BEGIN
 4     DECLARE
 5         i INT DEFAULT 1 ;
 6     WHILE i < n DO
 7         INSERT INTO t_user_memory (
 8             c_user_id,
 9             c_name,
10             c_province_id,
11             c_city_id,
12             create_time
13         )
14     VALUES
15         (
16             uuid(),
17             randStr (20),
18             FLOOR(RAND() * 1000),
19             RAND() * 100,
20             NOW()
21         );
22 SET i = i + 1 ;
23 END
24 WHILE ;
25 END $$

 

  • 執行過程中的問題

在完成上面的聲明之後我們就可以用CALL  add_t_user_memory (1000000)來創建100w的數據啦,這大概需要20分鐘的時間。但是在調用的過程中卻發現了一個問題如下圖所示。

原來是't_user_memory' 已經滿了。它是我在上面定義的用記憶體存放數據的表,在MYSQL中預設的大小是16MB。這個大小隻能放4w多條數據,所以我們要想辦法把它擴大。那麼可以執行下麵語句

1 SET GLOBAL max_heap_table_size = 1024 * 1024 * 1024 * 1;
2 
3 #查看當前的設置的大小
4 select @@max_heap_table_size;

註意:修改需要重新鏈接mysql才能更新修改。這個修改自己機器上玩玩就可以了,在生產環境這麼改有什麼後果我可不負責。

 

  • 完善資料庫
  1. 執行下麵語句,大概需要10s就可以插入到t_user中。
INSERT INTO t_user SELECT * FROM t_user_memory;

  2.打亂創建時間。

#更新年間隔
UPDATE t_user SET create_time=date_add(create_time, interval FLOOR(1 + (RAND() * 4)) year);
#更新秒間隔
UPDATE t_user SET create_time=randDataTime(NOW(),create_time);
  • 完成

這樣,我們的百萬級資料庫就創建完成啦!然後,我們可以將t_user_memory這個表清空,畢竟它是很占記憶體的,你數據有多少記憶體就占多少。下次再結合業務試試SQL優化怎麼玩。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. MIPI CSI2簡介 MIPI聯盟是一個開放的會員制組織。2003年7月,由美國德州儀器(TI)、意法半導體(ST)、英國ARM和芬蘭諾基亞(Nokia)4家公司共同成立。MIPI聯盟旨在推進移動應用處理器介面的標準化 。MIPI聯盟下麵有不同的WorkGroup,分別定義了一系列的手機內部 ...
  • 本文主要講解通過curl 實現表單提交登錄。單獨的表單提交與表單登錄都差不多,因此就不單獨說了。 說明:針對curl表單提交實現登錄,不是所有網站都適用,原因是有些網站後臺做了限制或有其他校驗。我們不知道這些網站後臺的限制或校驗機制具體是什麼,因此直接curl表單登錄可能是不行的。 當然,如下案例是 ...
  • hadoop(二MapReduce) 介紹 MapReduce:其實就是把數據分開處理後再將數據合在一起. Map負責“分”,即把複雜的任務分解為若幹個“簡單的任務”來並行處理。可以進行拆分的前提是這些小任務可以並行計算,彼此間幾乎沒有依賴關係。Reduce負責“合”,即對map階段的結果進行全局匯 ...
  • 在上一篇中,我們談到過 要提升電腦的性能,可以從上面這三方面著手。 通過指令數/CPI,好像都太難了。 因此工程師們,就在CPU上多放晶體管,不斷提升CPU的時鐘頻率,讓CPU更快,程式的執行時間就會縮短。 從1978年Intel發佈的8086 CPU開始,電腦的主頻從5MHz開始,不斷攀升 1 ...
  • UNPIVOT特點 UNPIVOT運算符通過將列旋轉到行來執行PIVOT的反向操作,UNPIVOT 並不完全是 PIVOT 的逆操作。 PIVOT 執行聚合,並將多個可能的行合併為輸出中的一行。UNPIVOT 不重現原始表值表達式的結果,因為行已被合併。 另外,UNPIVOT 輸入中的 NULL 值 ...
  • 學過大數據的人都應該知道kafka、RabbitMQ這些分散式消息訂閱系統,本文今天著重講解下kakfa。kafka有非常好的橫向擴展性,可實時存儲海量數據,是流數據處理中間件的事實標準。本文將介紹Kafka是如何保證數據可靠性和一致性的。 數據可靠性 kafka作為一個商業級消息中間件,消息的可靠 ...
  • MySQL是現在普遍使用的資料庫,但是如果宕機了必然會造成數據丟失。為了保證MySQL資料庫的可靠性,就要會一些提高可靠性的技術。MySQL主從複製可以做到實時熱備數據。本文介紹MySQL主從複製原理及其配置過程。 術語:主從複製——master slave replication(M-S模式)。 ...
  • 一臺ORACLE實例(Oracle Database 10g Release 10.2.0.5.0)啟動時,報“Error 942 occured during Initialization of Bufq KUPC$S_1_20181023155636”錯誤,具體情況如下所示,內容信息來自告警日誌... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...