9個SQL運維常遇到的問題

来源:https://www.cnblogs.com/huaweiyun/archive/2022/10/12/16784688.html
-Advertisement-
Play Games

摘要:本文重點介紹單個SQL語句持續執行慢的場景。 本文分享自華為雲社區《GaussDB(DWS) SQL性能問題案例集》,作者:黎明的風。 本文重點介紹單個SQL語句持續執行慢的場景。我們可以對執行慢的SQL進行單獨分析,SELECT、INSERT、UPDATE等語句都可以使用explain ve ...


摘要:本文重點介紹單個SQL語句持續執行慢的場景。

本文分享自華為雲社區《GaussDB(DWS) SQL性能問題案例集》,作者:黎明的風。

本文重點介紹單個SQL語句持續執行慢的場景。我們可以對執行慢的SQL進行單獨分析,SELECT、INSERT、UPDATE等語句都可以使用explain verbose + SQL語句輸出查詢計劃來進行分析,這樣只輸出查詢計劃,語句不會被實際的執行。

如果查詢計劃只出現__REMOTE_FQS_QUERY__或__REMOTE_LIGHT_QUERY__,看不到具體的計劃,可以先執行set enable_fast_query_shipping to off; 然後再重新列印執行計劃。

經常遇到的問題有以下幾個:

【案例1】語句中包含不下推的函數

檢查查詢計劃中是否包含_REMOTE_TABLE_QUERY_關鍵字, 如果有則表示語句沒有下推,數據需要從DN上收取到CN上,然後語句在CN上執行。語句不下推原因,要從CN的日誌中查找,搜索的關鍵字為:SQL can’t be shipped,以下為函數造成的不下推例子:

LOG: SQL can't be shipped, reason: Function Fun1() can not be shipped

此外如果出現以下幾種不下推的關鍵字:__REMOTE_GROUP_QUERY__、__REMOTE_LIMIT_QUERY__、

__REMOTE_SORT_QUERY__。這種需要檢查enable_stream_operator參數是否處於關閉狀態,一般來說打開STREAM開關後,語句就可以下推執行了。

如果出現以下兩種關鍵字,表示語句可以下推執行:

__REMOTE_FQS_QUERY__:表明語句走了Fast Query Shipping(FQS),SQL語句會下發到DN上執行,並且各DN之間沒有數據交互,常見的場景有過濾條件為等值查詢(where id = 1),或者關聯的列是表的分佈列的查詢(where t1.id = t2.id)。

__REMOTE_LIGHT_QUERY__:表明語句走了Light Proxy(CN輕量化),將語句下發給了單個DN去處理,常見的場景過濾條件是分佈列的等值查詢(where id = 1),或者向一個DN插入數據的INSERT語句。

【案例2】表上有索引但沒有走索引掃描,進行了全表掃描

從查詢計劃中可以看到Seq Scan或CStore Scan這樣的關鍵字,如下所示:

對於行存表:-> Seq Scan on t1

對於列存表:-> CStore Scan on col_t1

出現這種問題通常有以下幾種情況:

沒有對所查詢的表收集統計信息

如果表的實際行數很大,而估算行數很小,查詢時可能會走全表順序掃描,造成執行速度慢。此時通過analyze表更新統計信息,讓優化器選擇最佳的查詢計劃,一般就可以解決執行慢的問題。

【案例3】模糊匹配沒有走索引

後模糊匹配查詢可以通過建立一個BTREE索引來實現,需要根據數據類型設置索引的operator,對於text,varchar和char分別設置和text_pattern_ops,varchar_pattern_ops和bpchar_pattern_ops。

例如c1列的類型為text,創建索引時增加text_pattern_ops。

CREATE INDEX ON t1 (c1 text_pattern_ops);

創建索引後,可以看到語句執行時會使用到前面創建的索引,執行速度會變快。

【案例4】創建索引時所指定列的順序問題

多列複合索引的組織結構與單列欄位索引結構類似,按索引內表達式指定的順序編排。當創建多列複合索引時,選擇什麼樣的列的順序,對查詢性能會帶來一定的影響。

例如按照c_date,c1和c2列的順序建立檢索,如果符合c_date條件的數據很多,通過這個索引掃描的數據就很會很多,造成執行時間長。

新建多列複合索引,將查詢條件里的等值條件的列放到索引列的前面,先使用等值進行過濾,需要掃描的數據變少,查詢變快。

【案例5】分區表沒有分區剪枝進行了全表掃描

問題背景:XSYX局點使用MERGE INTO語句將每天的數據入庫到表裡,目標表為分區表,業務上線運行一段時間後發現MERGE INTO速度逐漸變慢。

原因分析:MERGE INTO語句的源表和目標表都是分區表,當前僅對源表增加了時間的過濾條件,可以進行分區剪枝。目標表由於沒有指定時間過濾條件,進行的是全表掃描,隨著每日的入庫業務運行,目標表的數據量越來越大,造成執行速度越來越慢。

解決方案:由於源表的數據在MERGE INTO時會導入到目標表的對應分區里,可以對目標表增加時間的過濾條件進行分區剪枝。

業務修改前的查詢計劃:

對目標表增加了時間過濾條件後的計劃顯示可以走分區剪枝:

【案例6】表數據在DN節點上有存儲傾斜

從查詢計劃中的A-time可以看到最長和最短的執行時間相差很大,說明在不同DN上掃描數據的時間不同。

在查詢計劃的DN信息中,通過rows可以看出在datanode1上掃描的數據量明顯多於datanode2,說明有存儲傾斜,這種情況建議對錶進行合理的設計,選擇合適的分佈列,將數據均勻分佈到所有的DN上。

【案例7】自定義函數引起執行慢

問題現象:查詢語句比較簡單,兩個表做關聯後輸出了其中一列的值,在輸出前增加了一個自定義函數對數據進行了處理。

原因分析:自定義函數里邏輯相對複雜,包含了對錶的查詢及數據計算邏輯,造成執行變慢。

解決方案;業務上對自定義函數進行性能優化。

【案例8】查詢視圖執行時間長

問題現象:某YD局點從C80版本遷移數據到8.1.1版本後,查詢PG_STAT_USER_TABLES視圖的時間由幾分鐘變成半個小時都不出結果。

原因分析:8.1.1版本中的PG_STAT_USER_TABLES視圖在獲取插入、更新、刪除的行數的欄位數值時,每一條記錄都涉及到CN和DN的交互,在數據量和集群規模大的情況下耗時較多。

解決方案:建議根據應用的實際需要,將視圖定義中不需要的函數註釋掉以提升查詢效率。

【案例9】關閉indexscan和bitmapscan後可以使用並行提升性能

問題現象: 查詢計劃中顯示走了Index Scan,通過索引查詢出的數據量比較大,速度慢。

原因分析:由於使用索引掃描時無法使用並行查詢,當索引訪問的數據量大時執行速度較慢。

解決方案:將enable_indexscan和enable_bitmapscan參數關閉,設置query_dop後走並行查詢。

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 作為電腦畢業的我,說起來慚愧,大學時候很多重要的專業課都沒好好聽過,慶幸的是,大學的很多教師課件我都有保存下來。這幾天,把《操作系統》拿起來看看,然後涉及到一些我認為重要的理論知識我會在這個專題都會記錄下來,這將會是一個持續的過程。 1、操作系統的目標 2、操作系統的作用 其中:四類資源是:處理器 ...
  • 最近谷歌官方宣稱由於使用人數少,關停了中國的翻譯服務,導致谷歌瀏覽器上的翻譯服務無法使用,當我們使用谷歌瀏覽器自帶翻譯功能時,會報出:無法翻譯此網頁,或者沒有翻譯反應。 在macOS下怎麼解決谷歌瀏覽器Chrome無法翻譯呢?下麵小編來教你快速解決。 1、打開終端(commond+空格 搜索“終端” ...
  • 一、CentOS 7.9 安裝 elasticsearch-7.8.1 地址 https://www.elastic.co https://www.elastic.co/cn/downloads/past-releases https://github.com/elastic https://git ...
  • 分離部署LNMP 環境說明: | 系統 | 主機名 | IP | 服務 | | | | | | | centos8 | nginx | 192.168.111.141 | nginx | | centos8 | mysql | 192.168.111.142 | mysql | | centos8 ...
  • nginx 一、nginx簡介 nginx(發音同engine x)是一款輕量級的Web伺服器/反向代理伺服器及電子郵件(IMAP/POP3)代理伺服器,併在一個BSD-like協議下發行。 nginx由俄羅斯的程式設計師Igor Sysoev所開發,最初供俄國大型的入口網站及搜尋引擎Rambler ...
  • Redis有3種實現持久化的方式:AOF日誌、RDB快照、混合持久化 Redis寫入AOF日誌的過程 Redis執行完寫操作命令後,將命令追加到server.aof_buf緩衝區 通過write()系統調用,將aof_buf緩衝區的數據寫入到AOF文件 數據被拷貝到了內核緩衝區page cache ...
  • 一、MySQL資料庫內置系統表 mysql5.7之後的版本自帶資料庫為 1.information_schema資料庫 這個庫在mysql中就是個信息資料庫,它保存著mysql伺服器所維護的所有其他資料庫的信息,包括了資料庫名,表名,欄位名等。在註入中,infromation_schema庫的作用無 ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 文章導讀: 什麼是Undo Log? Undo:意為撤銷或取消,以撤銷操作為目的,返回某個狀態的操作。 Undo Log:資料庫事務開始之前,會將要修改 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...