拒絕“爆雷”!GaussDB(for MySQL)新上線了這個功能

来源:https://www.cnblogs.com/huaweiyun/archive/2023/03/29/17268336.html
-Advertisement-
Play Games

摘要:智能把控大數據量查詢,防患系統奔潰於未然。 本文分享自華為雲社區《拒絕“爆雷”!GaussDB(for MySQL)新上線了這個功能》,作者:GaussDB 資料庫。 什麼是最大讀取行 一直以來,大數據量查詢是資料庫DBA們調優的重點,DBA們通常十八般武藝輪番上陣以期提升大數據查詢的性能:例 ...


摘要:智能把控大數據量查詢,防患系統奔潰於未然。

本文分享自華為雲社區《拒絕“爆雷”!GaussDB(for MySQL)新上線了這個功能》,作者:GaussDB 資料庫。

什麼是最大讀取行

一直以來,大數據量查詢是資料庫DBA們調優的重點,DBA們通常十八般武藝輪番上陣以期提升大數據查詢的性能:例如分庫分表、給表增加索引、設定合理的WHERE查詢條件、限定單次查詢的條數……

然而,DBA再厲害,應用程式千千萬,寫代碼的程式員萬碼奔騰,大數據量的查詢像地雷,不定什麼時候就爆了。比如隱藏在某段代碼里的查詢,因為一個新手程式員的經驗不足,查詢代碼寫得欠佳,沒有WHERE子句或缺少索引引發了不必要的多行讀取,甚至全表掃描,給伺服器帶來了過度的壓力,導致業務執行緩慢,甚至最後伺服器OOM崩潰。

為了避免這種“爆雷”,GaussDB(for MySQL)近期上線了最大讀取行特性。優化器產生執行計劃後,如果優化器預估的讀取行數超過了所設置的最大讀取行閾值,則自動中止查詢,將雷的導火索切斷。

這種機制的優點在於:執行計劃階段就對查詢進行了干預,而不是語句開始執行後在執行過程中進行中斷。既杜絕了劣質查詢對伺服器和業務運行造成的風險,又大大節省了時間和資源。

如何設置最大讀取行

在GaussDB(for MySQL)中,設置rds_max_row_read,指定查詢允許讀取的最大行數。GaussDB(for MySQL)收到查詢指令,執行查詢之前,會對查詢要讀取的行數進行估計。當估值超過所設置的最大讀取行時,將中止查詢,即查詢沒有機會運行,提前規避不必要的資源消耗。

下麵是一份測試數據,說明瞭開啟最大讀取行前後的差異。

假設表t1有4M大小的行,當開發人員或應用程式嘗試運行以下查詢時,運行需要7分鐘。

mysql> SELECT  *  FROM t1;

WHERE子句的缺失致使需要全表掃描,查詢耗時長。對於更大的表,這類查詢將需要更多的耗時,使伺服器消耗更多資源,查詢耗時甚至可能高達數小時。

最大讀取行特性的使用,可以節省寶貴的時間和資源。比如假設將最大讀取行數指定為1000000:

mysql> set rds_max_row_read =1000000;
Query OK, 0 rows affected (0.00 sec)

修改後,重新運行不含WHERE子句的查詢,收到了讀取行超限的提示,查詢被停止。

   mysql> SELECT  *  FROM t1;
ERROR HY000: Expected number of read rows exceeds the maximum allowed (see @@rds_max_row_read)

通過最大讀取行,相當於擁有了一個工具,DBA或者軟體工程師根據業務情況可以自如設置和調整限制規則,保證業務正常運行的同時,限制次優查詢,避免性能異常。

適用範圍

適用於SELECT、CREATE SELECT和INSERT SELECT。

功能開啟

預設情況下,該功能是禁用的,只有當rds_max_row_read設置了值時,該功能才會被激活。

為了功能的穩定,避免無心的錯誤設置對業務造成不必要的影響,rds_max_row_read做了最低值限制,不允許用戶設置比最低值更低的值。

實現原理

GaussDB(for MySQL)通過遍歷每個查詢塊並聚合各查詢塊的貢獻來整體評估查詢的讀取行數:也就是對各join對象的讀取行數評估後累加。

如果在累加評估過程中的某一刻,估計值超過了所設置的限制,查詢將被終止。

對於關聯子查詢,評估辦法為:評估子查詢的讀取行數,然後乘以查詢被執行的次數。

需要特別說明的是,對每個JOIN對象的估計是執行計劃預估返回的行數,可能與真實執行返回的行數有偏差。這雖然是一個相對簡單的評估模型,但是我們堅信其具有足夠的魯棒性。

對於複雜查詢,GaussDB(for MySQL)還通過optimizer trace提供了更多信息以幫助您確定優化器做決策的原因及如何優化查詢。

示例

示例1

mysql> EXPLAIN format=tree SELECT * FROM table_1, table_2;
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| EXPLAIN                                                                                                                                                                   |
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| -> Inner hash join (no condition)  (cost=6.50 rows=54)
    -> Table scan on table_1  (cost=0.19 rows=9)
    -> Hash
        -> Table scan on table_2  (cost=0.85 rows=6)
 |
+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
mysql> SET rds_max_row_read =20;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT * FROM table_1, table_2;
ERROR 1888 (HY000): The expected number of read rows exceeds the allowed maximum (see @@rds_max_row_read)

查詢讀取的行太多,我們嘗試在optimizer trace的幫助下尋找原因:

SET optimizer_trace="enabled=on";
SELECT * from table_1, table_2;
SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

在optimizer trace中,可以找到:

{
            "Max_row_read": {
              "select#": 1,
              "current_estimate_of_rows": 54,
              "rows_contributed_by_this_query_block": 54
            }
          }

這表示此查詢中的唯一查詢塊,行讀取數為54。

執行計劃中的這個評估有多準確呢?

執行如下查詢查看語句實際被執行的次數:

mysql> show status like "handler_read_rnd_next";
+----------------------------+-------+
| Variable_name              | Value |
+----------------------------+-------+
| Handler_read_rnd_next      | 17    |
+----------------------------+-------+
1 rows in set (0.00 sec)

handler_read_rnd_next顯示實際上的讀取是17行,而不是54行。

這個17是怎麼來的呢?

這是一個哈希連接:

-遍歷整張表時,左表有9行數據+1行額外行。

-右表有6行+1行額外行。

優化器中會預估返回讀取行,例如,54。在這個示例中,它並沒有很好地猜測到返回的行數,它高估了行讀取的數量。在大多數情況下,讀取行數的估計不夠精確,但可以肯定的是,它是足夠穩健的,能達到相應的目的。

示例2

創建例表t1:

mysql> CREATE TABLE t1(a INT);

在表中填充1536行數據後。將rds_max_row_read設置為500,進行以下測試查詢:

mysql> SELECT * FROM t1 WHERE a>6;
ERROR HY000: Expected number of read rows exceeds the maximum allowed (see @@rds_max_row_read)

在optimizer trac的幫助下,可以看到優化器估計的讀取行數是512行,因此查詢被終止。如果在a欄位上添加索引(這是一件明智的事情),同一查詢的估計讀取行數是1,查詢檢測順利通過。

這個簡單的示例說明:最大讀取行能幫助您編寫更加優質的查詢語句。

結論

最大讀取行特性針對讀取過多行的查詢,識別和過濾出效率低下的查詢。用戶可以為讀取行數設置閾值,超過該閾值則終止查詢。為了識別此類查詢,GaussDB(for MySQL)在優化器中進行了讀取總行數的粗略估計。當查詢終止時,可以檢查optimizer trace,從中收集線索,以幫助重寫更高效的查詢。

簡而言之,最大讀取行為用戶提供了一個工具,使他們可以更充分地利用手上的資源。

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本文收集了170多個windows11上的快捷鍵,其中有少部分是windows11新添加的。大部分的win10快捷鍵也適用於win11。這些快捷鍵涵蓋了系統設置、命令行程式執行、Snap佈局切換、對話框快速處理等諸多方面,這裡收錄的是這些分類中最常用的快捷鍵。 編寫博文的過程中,我已驗證了其中90% ...
  • 參考:(25條消息) 虛擬機安裝Arch Linux_虛擬機安裝archlinux_追光少年羽的博客-CSDN博客 準備工作 在開始安裝 Arch Linux 之前,需要先下載安裝映像文件並創建好虛擬機環境。 下載安裝鏡像 下麵是 Arch Linux 官方的安裝文件下載地址: Arch Linux ...
  • 解決辦法 如果最近升級到了 openssh 8.8 版,你會發現連接某些之前連接得好好的伺服器突然無法連接: Unable to negotiate with x.x.x.x port 2222: no matching host key type found. Their offer: ssh-r ...
  • 1. 三值邏輯 1.1. 真 1.1.1. true 1.2. 假 1.2.1. false 1.3. 不確定 1.3.1. unknown 2. 兩種NULL 2.1. 未知”(unknown) 2.1.1. 不知道戴墨鏡的人眼睛是什麼顏色 2.1.2. 雖然現在不知道,但加上某些條件後就可以知道 ...
  • 通過Hbase與Cassandra對比,層次展開瞭解Apache Cassandra特性和使用場景,通過部署但實力和多實例集群進一步理解其運作,最後通過CQL及其客戶端命令工具理解其數據模型和數據類型,通過對鍵空間、表、索引、數據操作熟悉常見CQL語法和使用。 ...
  • 所需準備 1.安裝資料庫實例,如SQLEXPRADV_x64_CHS 2.安裝資料庫管理軟體,如SQL Server Management Studio 操作步驟 1.打開SQL Server Management Studio,使用Windows身份驗證登入。 2.點擊伺服器實例,右鍵屬性->安全 ...
  • Redis資料庫 Redis(Remote Dictionary Server)是一個使用 C 語言編寫的,高性能非關係型的鍵值對資料庫。與傳統資料庫不同的是,Redis 的數據是存在記憶體中的,所以讀寫速度非常快,被廣泛應用於緩存方向。Redis可以將數據寫入磁碟中,保證了數據的安全不丟失,而且Re ...
  • RMAN備份時會記錄每一次備份的狀態信息,例如COMPLETED,FAILED等,但是使用下麵腳本查詢資料庫時,偶爾你會看到有些備份的狀態為COMPLETED WITH WARNINGS SET LINESIZE 1080;COL STATUS FORMAT A9;COL START_TIME FO ...
一周排行
    -Advertisement-
    Play Games
  • 1. 說明 /* Performs operations on System.String instances that contain file or directory path information. These operations are performed in a cross-pla ...
  • 視頻地址:【WebApi+Vue3從0到1搭建《許可權管理系統》系列視頻:搭建JWT系統鑒權-嗶哩嗶哩】 https://b23.tv/R6cOcDO qq群:801913255 一、在appsettings.json中設置鑒權屬性 /*jwt鑒權*/ "JwtSetting": { "Issuer" ...
  • 引言 集成測試可在包含應用支持基礎結構(如資料庫、文件系統和網路)的級別上確保應用組件功能正常。 ASP.NET Core 通過將單元測試框架與測試 Web 主機和記憶體中測試伺服器結合使用來支持集成測試。 簡介 集成測試與單元測試相比,能夠在更廣泛的級別上評估應用的組件,確認多個組件一起工作以生成預 ...
  • 在.NET Emit編程中,我們探討了運算操作指令的重要性和應用。這些指令包括各種數學運算、位操作和比較操作,能夠在動態生成的代碼中實現對數據的處理和操作。通過這些指令,開發人員可以靈活地進行算術運算、邏輯運算和比較操作,從而實現各種複雜的演算法和邏輯......本篇之後,將進入第七部分:實戰項目 ...
  • 前言 多表頭表格是一個常見的業務需求,然而WPF中卻沒有預設實現這個功能,得益於WPF強大的控制項模板設計,我們可以通過修改控制項模板的方式自己實現它。 一、需求分析 下圖為一個典型的統計表格,統計1-12月的數據。 此時我們有一個需求,需要將月份按季度劃分,以便能夠直觀地看到季度統計數據,以下為該需求 ...
  • 如何將 ASP.NET Core MVC 項目的視圖分離到另一個項目 在當下這個年代 SPA 已是主流,人們早已忘記了 MVC 以及 Razor 的故事。但是在某些場景下 SSR 還是有意想不到效果。比如某些靜態頁面,比如追求首屏載入速度的時候。最近在項目中回歸傳統效果還是不錯。 有的時候我們希望將 ...
  • System.AggregateException: 發生一個或多個錯誤。 > Microsoft.WebTools.Shared.Exceptions.WebToolsException: 生成失敗。檢查輸出視窗瞭解更多詳細信息。 內部異常堆棧跟蹤的結尾 > (內部異常 #0) Microsoft ...
  • 引言 在上一章節我們實戰了在Asp.Net Core中的項目實戰,這一章節講解一下如何測試Asp.Net Core的中間件。 TestServer 還記得我們在集成測試中提供的TestServer嗎? TestServer 是由 Microsoft.AspNetCore.TestHost 包提供的。 ...
  • 在發現結果為真的WHEN子句時,CASE表達式的真假值判斷會終止,剩餘的WHEN子句會被忽略: CASE WHEN col_1 IN ('a', 'b') THEN '第一' WHEN col_1 IN ('a') THEN '第二' ELSE '其他' END 註意: 統一各分支返回的數據類型. ...
  • 在C#編程世界中,語法的精妙之處往往體現在那些看似微小卻極具影響力的符號與結構之中。其中,“_ =” 這一組合突然出現還真不知道什麼意思。本文將深入剖析“_ =” 的含義、工作原理及其在實際編程中的廣泛應用,揭示其作為C#語法奇兵的重要角色。 一、下劃線 _:神秘的棄元符號 下劃線 _ 在C#中並非 ...