mysql自增id超大問題查詢

来源:https://www.cnblogs.com/iforever/archive/2018/12/05/10071733.html
-Advertisement-
Play Games

引言 小A正在balabala寫代碼呢,DBA小B突然發來了一條消息,“快看看你的用戶特定信息表T,裡面的主鍵,也就是自增id,都到16億了,這才多久,在這樣下去過不了多久主鍵就要超出範圍了,插入就會失敗,balabala......” 我記得沒有這麼多,最多1k多萬,count了下,果然是1100 ...


引言

小A正在balabala寫代碼呢,DBA小B突然發來了一條消息,“快看看你的用戶特定信息表T,裡面的主鍵,也就是自增id,都到16億了,這才多久,在這樣下去過不了多久主鍵就要超出範圍了,插入就會失敗,balabala......”

我記得沒有這麼多,最多1k多萬,count了下,果然是1100萬。原來運維是通過auto_increment那個值看的,就是說,表中有大量的刪除插入操作,但是我大部分情況都是更新的,怎麼會這樣?

問題排查

這張表是一個簡單的介面服務在使用,每天大數據會統計一大批信息,然後推送給小A,小A將信息更新到資料庫中,如果是新數據就插入,舊數據就更新之前的數據,對外介面就只有查詢了。

很快,小A就排查了一遍自己的代碼,沒有刪除的地方,也沒有主動插入、更新id的地方,怎麼會這樣呢?難道是小B的原因,也不太可能,DBA那邊兒管理很多表,有問題的話早爆出來了,但問題在我這裡哪裡也沒頭緒。

小A又仔細觀察了這1000多萬已有的數據,將插入時間、id作為主要觀察欄位,很快,發現了個問題,每天第一條插入的數據總是比前一天多1000多萬,有時候遞增的多,有時候遞增的少,小A又將矛頭指向了DBA小B,將問題又給小B描述了一遍。

小B問了小A,“你是是不是用了REPLACE INTO ...語句”,這是怎麼回事呢,原來REPLACE INTO ...會對主鍵有影響。

REPLACE INTO ...對主鍵的影響

假設有一張表t1:

CREATE TABLE `t1` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT 'ID,自增',
  `uid` bigint(20) unsigned NOT NULL DEFAULT '0' COMMENT '用戶uid',
  `name` varchar(20) NOT NULL DEFAULT '' COMMENT '用戶昵稱',
  PRIMARY KEY (`id`),
  UNIQUE KEY `u_idx_uid` (`uid`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='測試replace into';

如果新建這張表,執行下麵的語句,最後的數據記錄如何呢?

insert into t1 values(NULL, 100, "test1"),(NULL, 101, "test2");
replace into t1 values(NULL, 100, "test3");

原來,REPLACE INTO ...每次插入的時候如果唯一索引對應的數據已經存在,會刪除原數據,然後重新插入新的數據,這也就導致id會增大,但實際預期可能是更新那條數據。

小A說:“我知道replace是這樣,所有既沒有用它”,但還是又排查了一遍,確實不是自己的問題,沒有使用REPLACE INTO ...

小A又雙叒叕仔細的排查了一遍,還是沒發現問題,就讓小B查下binlog日誌,看看是不是有什麼奇怪的地方,查了之後還是沒發現問題,確實存在跳躍的情況,但並沒有實質性的問題。

下圖中@1的值對應的是自增主鍵id,用(@2, @3)作為唯一索引

後來過了很久,小B給小A指了個方向,小A開始懷疑自己的插入更新語句INSERT ... ON DUPLICATE KEY UPDATE ...了,查了許久,果然是這裡除了問題。

INSERT ... ON DUPLICATE KEY UPDATE ...對主鍵的影響

這個語句跟REPLACE INTO ...類似,不過他並不會變更該條記錄的主鍵,還是上面t1這張表,我們執行下麵的語句,執行完結果是什麼呢?

insert into t1 values(NULL, 100, "test4") on duplicate key update name = values(name);

沒錯,跟小A預想的一樣,主鍵並沒有增加,而且name欄位已經更新為想要的了,但是執行結果有條提示,引起了小A的註意

No errors; 2 rows affected, taking 10.7ms

明明更新了一條數據,為什麼這裡的影響記錄條數是2呢?小A,又看了下目前表中的auto_increment

CREATE TABLE `t1` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT 'ID,自增',
  `uid` bigint(20) unsigned NOT NULL DEFAULT '0' COMMENT '用戶uid',
  `name` varchar(20) NOT NULL DEFAULT '' COMMENT '用戶昵稱',
  PRIMARY KEY (`id`),
  UNIQUE KEY `u_idx_uid` (`uid`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8 COMMENT='測試replace into';

竟然是5`,這裡本應該是4的。

也就是說,上面的語句,會跟REPLACE INTO ...類似的會將自增ID加1,但實際記錄沒有加,這是為什麼呢?

查了資料之後,小A得知,原來,mysql主鍵自增有個參數innodb_autoinc_lock_mode,他有三種可能只0,1,2,mysql5.1之後加入的,預設值是1,之前的版本可以看做都是0

可以使用下麵的語句看當前是哪種模式

select @@innodb_autoinc_lock_mode;

小A使用的資料庫預設值也是1,當做簡單插入(可以確定插入行數)的時候,直接將auto_increment加1,而不會去鎖表,這也就提高了性能。當插入的語句類似insert into select ...這種複雜語句的時候,提前不知道插入的行數,這個時候就要要鎖表(一個名為AUTO_INC的特殊表鎖)了,這樣auto_increment才是準確的,等待語句結束的時候才釋放鎖。還有一種稱為Mixed-mode inserts的插入,比如INSERT INTO t1 (c1,c2) VALUES (1,'a'), (NULL,'b'), (5,'c'), (NULL,'d'),其中一部分明確指定了自增主鍵值,一部分未指定,還有我們這裡討論的INSERT ... ON DUPLICATE KEY UPDATE ...也屬於這種,這個時候會分析語句,然後按儘可能多的情況去分配auto_incrementid,這個要怎麼理解呢,我看下麵這個例子:

truncate table t1;
insert into t1 values(NULL, 100, "test1"),(NULL, 101, "test2"),(NULL, 102, "test2"),(NULL, 103, "test2"),(NULL, 104, "test2"),(NULL, 105, "test2");

-- 此時數據表下一個自增id是7

delete from t1 where id in (2,3,4);

-- 此時數據表只剩1,5,6了,自增id還是7

insert into t1 values(2, 106, "test1"),(NULL, 107, "test2"),(3, 108, "test2");

-- 這裡的自增id是多少呢?

上面的例子執行完之後表的下一個自增id是10,你理解對了嗎,因為最後一條執行的是一個Mixed-mode inserts語句,innoDB會分析語句,然後分配三個id,此時下一個id就是10了,但分配的三個id並不一定都使用。此處** @總是遲到[zongshichidao] ** 多謝指出,看官方文檔理解錯了

模式0的話就是不管什麼情況都是加上表鎖,等語句執行完成的時候在釋放,如果真的添加了記錄,將auto_increment加1。

至於模式2,什麼情況都不加AUTO_INC鎖,存在安全問題,當binlog格式設置為Statement模式的時候,從庫同步的時候,執行結果可能跟主庫不一致,問題很大。因為可能有一個複雜插入,還在執行呢,另外一個插入就來了,恢復的時候是一條條來執行的,就不能重現這種併發問題,導致記錄id可能對不上。

至此,id跳躍的問題算是分析完了,由於innodb_autoinc_lock_mode值是1,INSERT ... ON DUPLICATE KEY UPDATE ...是簡單的語句,預先就可以計算出影響的行數,所以不管是否更新,這裡都將auto_increment加1(多行的話大於1)。

如果將innodb_autoinc_lock_mode值改為0,再次執行INSERT ... ON DUPLICATE KEY UPDATE ...的話,你會發現auto_increment並沒有增加,因為這種模式直接加了AUTO_INC鎖,執行完語句的時候釋放,發現沒有增加行數的話,不會增加自增id的。

INSERT ... ON DUPLICATE KEY UPDATE ...影響的行數是1為什麼返回2?

為什麼會這樣呢,按理說影響行數就是1啊,看看官方文檔的說明

With ON DUPLICATE KEY UPDATE, the affected-rows value per row is 1 if the row is inserted as a new row, 2 if an existing row is updated, and 0 if an existing row is set to its current values

官方明確說明瞭,插入影響1行,更新影響2行,0的話就是存在且更新前後值一樣。是不是很不好理解?

其實,你要這樣想就好了,這是為了區分到底是插入了還是更新了,返回1表示插入成功,2表示更新成功。

解決方案

innodb_autoinc_lock_mode設置為0肯定可以解決問題,但這樣的話,插入的併發性可能會受很大影響,因此小A自己想著DBA也不會同意。經過考慮,目前準備了兩種較為可能的解決方案:

修改業務邏輯

修改業務邏輯,將INSERT ... ON DUPLICATE KEY UPDATE ...語句拆開,先去查詢,然後去更新,這樣就可以保證主鍵不會不受控制的增大,但增加了複雜性,原來的一次請求可能變為兩次,先查詢有沒有,然後去更新。

刪除表的自增主鍵

刪除自增主鍵,讓唯一索引來做主鍵,這樣子基本不用做什麼變動,只要確定目前的自增主鍵沒有實際的用處即可,這樣的話,插入刪除的時候可能會影響效率,但對於查詢多的情況來說,小A比較兩種之後更願意選擇後者。

結語

其實INSERT ... ON DUPLICATE KEY UPDATE ...這個影響行數是2的,小A很早就發現了,只是沒有保持好奇心,不以為然罷了,沒有深究其中的問題,這深究就起來會帶出來一大串新知識,挺好,看來小A還是要對外界保持好奇心,保持敏感,這樣才會有進步。

原文鏈接:https://segmentfault.com/a/1190000017268633


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 對於一個純小白來說,安裝一個MySQL不是那麼容易,本來是按照老師給的步驟,一步一步進行應該不會出現什麼錯誤的,但由於個人電腦內部的配置問題,在安裝過程中不斷出問題,我覺得更重要的原因應該在於我,我作為一個純小白,你跟我說啥文件查找路徑錯誤,我都不知道去哪找這個配置路徑,反正關於操作系統的知識,我是 ...
  • 接上一篇 《JDK1.8中的線程池》 1. 任務執行失敗時的處理邏輯 1.1. Worker Worker相當於線程池中的線程 可以看到,Worker有幾個重要的屬性: thread : 這是Worker運行的線程,可以理解為一個Worker就是一個線程 firstTask : 初始任務,可能為為n ...
  • 正如整型int有對應的包裝整型Integer那樣,字元型char也有對應的包裝字元型Character。初始化字元包裝變數也有三種方式,分別是:直接用等號賦值、調用包裝類型的valueOf方法、使用關鍵字new創建新變數。倘若要把字元包裝變數轉換成字元變數,則調用包裝變數的charValue方法即可 ...
  • 題意 "題目鏈接" Sol 直接考慮點分治+hash匹配 設$up[i]$表示$dep \% M = i$的從下往上恰好與前$i$位匹配的個數 $down$表示$dep \% M = i$的從上往下恰好與後$i$位匹配的個數 暴力轉移即可 複雜度:$O(nlog^2n)??$ 代碼寫起來有一車邊界 ...
  • “工欲善其事,必先利其器”,這話我一直是這麼堅信的! 找到一款順手稱心的工具,擁有它,熟練地使用它! Pycharm據說就是使用Python的一款最好的工具—— 於是,開始了第一步的學習 先從熟悉主菜單開始吧,總不能一打開軟體,只會使用New、Run之類的簡單操作指令吧!一開始翻譯比較難,由於不習慣 ...
  • 本文主要介紹了關於PHP如何實現我們大家都知道的開心消消樂的演算法,分享PHP教程出來供大家參考學習,下麵話不多說了,來一起看看詳細的介紹吧。 一、需求描述: 1、在一個8*8的矩陣方格中隨機出現5種顏色的色塊。 2、當有三個或以上色塊在橫向或縱向上相連,則消除這些色塊。 3、色塊消除後,上方色塊往下 ...
  • bin()十進位轉二進位; oct()十進位轉二進位; hex()十進位轉二進位; 字元串: 索引: 查找: 移除空白: 長度: 替換: 切片: 分割: 連接: 首字母大寫; 居中、對齊: 計數: 以什麼開頭、結尾: 大小寫: 格式化輸出: ...
  • 1 開發環境: 1、eclipse(可替換) 2、jfreechart-1.0.19 2 說明: (1) source目錄:為 jfreechart的源碼目錄;不會的主要看這裡。因為他的文檔是收費的。 (2) lib目錄:為包目錄,我們需要關註的包為 jfreechart-1.0.10.jar、 g ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...