PostgreSQL (慢SQL|資料庫整體變慢|性能抖動) 資料庫性能分析與優化方法

来源:https://www.cnblogs.com/88223100/archive/2022/10/23/PostgreSQL-Database-Performance-Analysis-and-Optimization-Method.html
-Advertisement-
Play Games

本文將介紹三種資料庫變慢場景的分析與優化方法. 1、已經定位出的特定慢SQL 2、整個資料庫實例(幾乎所有SQL)變慢, 或者某些時候整個資料庫實例大面積SQL變慢(大面積抖動) 3、某些正常情況下很快的SQL偶爾會變慢(抖動) ...


背景

本文將介紹三種資料庫變慢場景的分析與優化方法.

  • 1、已經定位出的特定慢SQL
  • 2、整個資料庫實例(幾乎所有SQL)變慢, 或者某些時候整個資料庫實例大面積SQL變慢(大面積抖動)
  • 3、某些正常情況下很快的SQL偶爾會變慢(抖動)

在優化之前

“治未病”的概念最早出現於《黃帝內經》,在《素問·四氣調神大論》中提出:“是故聖人不治已病治未病,不治已亂治未亂,此之謂也。 夫病已成而後藥之,亂已成而後治之,譬猶渴而穿井,鬥而鑄錐,不亦晚乎”,就生動地指出了“治未病”的重要意義。

資料庫優化固然重要, 但這是治已病, 未病則更加重要. 未病建議參考:

一、單一慢SQL優化

單一SQL慢, 比較容易解決, 從執行計劃入手即可, 是否執行計劃不正確, 是否索引未創建或不合理, 是否需要改寫SQL, 是否有膨脹, 是否存在業務邏輯導致的長時間鎖衝突, 是否SQL過於複雜需要固定執行計劃或者採用更高級的優化器.

常用分析工具與方法:

  • explain, 分析執行計劃
  • 索引推薦
  • 檢查膨脹
  • perf, 分析單條SQL(或函數)執行時的代碼瓶頸
  • 鎖等待分析
  • 查詢 其他會話中正在運行的SQL memory context
  • show 其他會話中正在運行的SQL的執行計劃
  • 動態優化
  • 指定、固定、篡改執行計劃
  • 資料庫存儲組織、資料庫索引組織、優化器演算法、數據掃描方法等原理

例子, 查詢所有感測器上報數據的最新值:

create unlogged table tbl_log (gid int, info text, crt_time timestamp);  
  
insert into tbl_log select random()*10, md5(random()::Text), clock_timestamp() from generate_series(1,5000000);  
  
select gid,info,crt_Time from   
  (select *, row_number() over (partition by gid order by crt_time desc) as rn from tbl_log) t  
where rn=1;   
  
 gid |               info               |          crt_time            
-----+----------------------------------+----------------------------  
   0 | 144ccff07b812d0ca5252ae8cbc2ad50 | 2022-08-23 14:59:59.531316  
   1 | 22fb4e6bb2daa15fcb8b00358bb4f3ad | 2022-08-23 14:59:59.531342  
   2 | 43761591e939309f1bb9e2b94f642e6d | 2022-08-23 14:59:59.531356  
   3 | 1751a3a7884685ec2c16926b4e2ad607 | 2022-08-23 14:59:59.531341  
   4 | 5df93803d19bf3a6bd19b7d017757bed | 2022-08-23 14:59:59.531348  
   5 | c11384fa2434c67992d14da837f65ac0 | 2022-08-23 14:59:59.531352  
   6 | ea33278a5f8d75c75ddbcbf7d753367f | 2022-08-23 14:59:59.531355  
   7 | c98c67d0a08c2f6dc865a291997748d5 | 2022-08-23 14:59:59.531347  
   8 | 644215ca6c3f2ad0fc1c0387a8e5c4fb | 2022-08-23 14:59:59.53133  
   9 | d0b554588b4a1d3de9fddcac630234ea | 2022-08-23 14:59:59.531354  
  10 | 903c0dda9ddfbd241043b8d75b4eaf22 | 2022-08-23 14:59:59.531351  
(11 rows)  
  
Time: 2230.696 ms (00:02.231)  

查看數據結構

postgres=# \d tbl_log  
                         Table "public.tbl_log"  
  Column  |            Type             | Collation | Nullable | Default   
----------+-----------------------------+-----------+----------+---------  
 gid      | integer                     |           |          |   
 info     | text                        |           |          |   
 crt_time | timestamp without time zone |           |          |   

查看SQL執行計劃:

返回11行記錄(rows=11), 但是掃描了將近20萬個數據塊(shared hit=16167 read=30562, temp read=72167 written=72315, 耗時707.021毫秒), 並且使用了外部排序(external merge Disk: 288672kB, 耗時4382.093-707.021毫秒).

 
explain (analyze,verbose,timing,costs,buffers) select gid,info,crt_Time from   
  (select *, row_number() over (partition by gid order by crt_time desc) as rn from tbl_log) t  
where rn=1;   
  
                                                                 QUERY PLAN                                                                    
---------------------------------------------------------------------------------------------------------------------------------------------  
 Subquery Scan on t  (cost=1342550.98..1505051.08 rows=25000 width=45) (actual time=4382.105..5406.218 rows=11 loops=1)  
   Output: t.gid, t.info, t.crt_time  
   Filter: (t.rn = 1)  
   Buffers: shared hit=16167 read=30562, temp read=72167 written=72315  
   ->  WindowAgg  (cost=1342550.98..1442551.04 rows=5000003 width=53) (actual time=4382.103..5406.203 rows=11 loops=1)  
         Output: tbl_log.gid, tbl_log.info, tbl_log.crt_time, row_number() OVER (?)  
         Run Condition: (row_number() OVER (?) <= 1)  
         Buffers: shared hit=16167 read=30562, temp read=72167 written=72315  
         ->  Sort  (cost=1342550.98..1355050.99 rows=5000003 width=45) (actual time=4382.093..4997.855 rows=5000000 loops=1)  
               Output: tbl_log.gid, tbl_log.crt_time, tbl_log.info  
               Sort Key: tbl_log.gid, tbl_log.crt_time DESC  
               Sort Method: external merge  Disk: 288672kB  
               Buffers: shared hit=16167 read=30562, temp read=72167 written=72315  
               ->  Seq Scan on public.tbl_log  (cost=0.00..96729.03 rows=5000003 width=45) (actual time=0.026..707.021 rows=5000000 loops=1)  
                     Output: tbl_log.gid, tbl_log.crt_time, tbl_log.info  
                     Buffers: shared hit=16167 read=30562  
 Planning Time: 0.092 ms  
 Execution Time: 5507.738 ms  
(18 rows)  
  
Time: 5508.182 ms (00:05.508)  

優化1:

gid, crt_time desc索引.

postgres=# create index idx_tbl_log_1 on tbl_log (gid,crt_time desc);  
CREATE INDEX  
Time: 3530.425 ms (00:03.530)  

重新查詢後, 使用了索引, 但是性能並沒有提升多少. 避免了外部排序, 但是依舊有大量的掃描(shared hit=16266 read=517194 written=8941, 耗時2736.351毫秒).

explain (analyze,verbose,timing,costs,buffers) select gid,info,crt_Time from   
  (select *, row_number() over (partition by gid order by crt_time desc) as rn from tbl_log) t  
where rn=1;   
  
                                                                          QUERY PLAN                                                                             
---------------------------------------------------------------------------------------------------------------------------------------------------------------  
 Subquery Scan on t  (cost=0.43..488005.99 rows=25000 width=45) (actual time=0.036..3116.007 rows=11 loops=1)  
   Output: t.gid, t.info, t.crt_time  
   Filter: (t.rn = 1)  
   Buffers: shared hit=16266 read=517194 written=8941  
   ->  WindowAgg  (cost=0.43..425505.99 rows=5000000 width=53) (actual time=0.035..3115.996 rows=11 loops=1)  
         Output: tbl_log.gid, tbl_log.info, tbl_log.crt_time, row_number() OVER (?)  
         Run Condition: (row_number() OVER (?) <= 1)  
         Buffers: shared hit=16266 read=517194 written=8941  
         ->  Index Scan using idx_tbl_log_1 on public.tbl_log  (cost=0.43..338005.99 rows=5000000 width=45) (actual time=0.026..2736.351 rows=5000000 loops=1)  
               Output: tbl_log.gid, tbl_log.crt_time, tbl_log.info  
               Buffers: shared hit=16266 read=517194 written=8941  
 Planning:  
   Buffers: shared hit=18 read=1 dirtied=2  
 Planning Time: 0.630 ms  
 Execution Time: 3116.041 ms  
(15 rows)  

優化2:

為瞭解決掃描的問題, 引入遞歸查詢, 需要修改SQL.

《重新發現PostgreSQL之美 - 6 index鏈表跳跳糖 (CTE recursive 遞歸的詳細用例)》

with RECURSIVE tmp as (  
(select tbl_log as t from tbl_log order by gid, crt_time desc limit 1)  
union all   
select (select tbl_log from tbl_log where tbl_log.gid > (tmp.t).gid order by tbl_log.gid, tbl_log.crt_time desc limit 1) as t  
from tmp where tmp.* is not null   
)  
select (tmp.t).* from tmp   
where tmp.* is not null;  
  
  
 gid |               info               |          crt_time            
-----+----------------------------------+----------------------------  
   0 | 144ccff07b812d0ca5252ae8cbc2ad50 | 2022-08-23 14:59:59.531316  
   1 | 22fb4e6bb2daa15fcb8b00358bb4f3ad | 2022-08-23 14:59:59.531342  
   2 | 43761591e939309f1bb9e2b94f642e6d | 2022-08-23 14:59:59.531356  
   3 | 1751a3a7884685ec2c16926b4e2ad607 | 2022-08-23 14:59:59.531341  
   4 | 5df93803d19bf3a6bd19b7d017757bed | 2022-08-23 14:59:59.531348  
   5 | c11384fa2434c67992d14da837f65ac0 | 2022-08-23 14:59:59.531352  
   6 | ea33278a5f8d75c75ddbcbf7d753367f | 2022-08-23 14:59:59.531355  
   7 | c98c67d0a08c2f6dc865a291997748d5 | 2022-08-23 14:59:59.531347  
   8 | 644215ca6c3f2ad0fc1c0387a8e5c4fb | 2022-08-23 14:59:59.53133  
   9 | d0b554588b4a1d3de9fddcac630234ea | 2022-08-23 14:59:59.531354  
  10 | 903c0dda9ddfbd241043b8d75b4eaf22 | 2022-08-23 14:59:59.531351  
(11 rows)  
  
Time: 0.603 ms  

掃描降低到了47個block, 同時避免了排序. 整體SQL耗時從5508.182毫秒降低到了0.6毫秒.

                                                                                  QUERY PLAN                                                                                    
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------  
 CTE Scan on tmp  (cost=61.21..63.23 rows=100 width=44) (actual time=0.061..0.342 rows=11 loops=1)  
   Output: (tmp.t).gid, (tmp.t).info, (tmp.t).crt_time  
   Filter: (tmp.* IS NOT NULL)  
   Rows Removed by Filter: 1  
   Buffers: shared hit=47  
   CTE tmp  
     ->  Recursive Union  (cost=0.43..61.21 rows=101 width=69) (actual time=0.047..0.316 rows=12 loops=1)  
           Buffers: shared hit=47  
           ->  Subquery Scan on "*SELECT* 1"  (cost=0.43..0.50 rows=1 width=69) (actual time=0.047..0.048 rows=1 loops=1)  
                 Output: "*SELECT* 1".t  
                 Buffers: shared hit=4  
                 ->  Limit  (cost=0.43..0.50 rows=1 width=81) (actual time=0.046..0.047 rows=1 loops=1)  
                       Output: tbl_log_1.*, tbl_log_1.gid, tbl_log_1.crt_time  
                       Buffers: shared hit=4  
                       ->  Index Scan using idx_tbl_log_1 on public.tbl_log tbl_log_1  (cost=0.43..338005.99 rows=5000000 width=81) (actual time=0.045..0.046 rows=1 loops=1)  
                             Output: tbl_log_1.*, tbl_log_1.gid, tbl_log_1.crt_time  
                             Buffers: shared hit=4  
           ->  WorkTable Scan on tmp tmp_1  (cost=0.00..5.97 rows=10 width=32) (actual time=0.019..0.019 rows=1 loops=12)  
                 Output: (SubPlan 1)  
                 Filter: (tmp_1.* IS NOT NULL)  
                 Rows Removed by Filter: 0  
                 Buffers: shared hit=43  
                 SubPlan 1  
                   ->  Limit  (cost=0.43..0.58 rows=1 width=81) (actual time=0.019..0.019 rows=1 loops=11)  
                         Output: tbl_log.*, tbl_log.gid, tbl_log.crt_time  
                         Buffers: shared hit=43  
                         ->  Index Scan using idx_tbl_log_1 on public.tbl_log  (cost=0.43..240899.23 rows=1666667 width=81) (actual time=0.018..0.018 rows=1 loops=11)  
                               Output: tbl_log.*, tbl_log.gid, tbl_log.crt_time  
                               Index Cond: (tbl_log.gid > (tmp_1.t).gid)  
                               Buffers: shared hit=43  
 Planning:  
   Buffers: shared hit=48  
 Planning Time: 0.538 ms  
 Execution Time: 0.391 ms  
(34 rows)  

練習:
更多例子等你反饋, 歡迎聯繫我.

甚至你要瞭解數據分佈, 掃描方法; 掌握資料庫的基本原理(存儲結構、索引結構、掃描優化器演算法等)對優化是非常有幫助的, 可以幫助你從根源找問題並提出優化思路.

下麵有個例子:

《PostgreSQL join+order by limit的優化例子 - 說明數據分佈與掃描方法對優化的關鍵作用》

背景知識:

1 代碼分析

https://www.man7.org/linux/man-pages/man1/perf.1.html

2 計劃分析

https://www.postgresql.org/docs/devel/sql-explain.html

《PostgreSQL explain analyze 火山圖火焰圖 圖形化性能分析軟體 pg_flame》

《PostgreSQL explain, parser, execute 過程資源使用統計分析 - perf , debug , log_planner_stats , log_xxx_stats》

《跨雲的K8S cloud native postgresql管理系統 誰在|會用? PG SaaS或工具或插件類產品 誰在|會用? (SQL規整、執行計劃解讀和優化建議、參數優化、AWR、索引推薦、錯誤日誌解讀和應對策略)》

《PostgreSQL 查詢當前執行中sql的執行計劃 - pg_show_plans》

3 常用SQL

《PostgreSQL DBA最常用SQL》

《PostgreSQL dba常用擴展函數庫 - pg_cheat_funcs》

《PostgreSQL DBA 日常管理 SQL》

《PostgreSQL 實時健康監控 大屏 - 低頻指標 - 珍藏級》

《PostgreSQL 實時健康監控 大屏 - 高頻指標(伺服器) - 珍藏級》

《PostgreSQL 實時健康監控 大屏 - 高頻指標 - 珍藏級》

4 鎖等待分析

《PostgreSQL 14 preview - 支持 lwlock blocking 診斷 - 增加 pg_lwlock_blocking_pid》

《PostgreSQL 誰堵塞了誰(鎖等待檢測)- pg_blocking_pids, pg_safe_snapshot_blocking_pids》

《PostgreSQL 誰堵塞了誰(鎖等待檢測)- pg_blocking_pids》

《PostgreSQL 鎖等待監控 珍藏級SQL - 誰堵塞了誰》

《PostgreSQL 鎖等待排查實踐 - 珍藏級 - process xxx1 acquired RowExclusiveLock on relation xxx2 of database xxx3 after xxx4 ms at xxx》

《PostgreSQL 鎖等待跟蹤》

5 索引推薦

《DB吐槽大會,第35期 - "富人"的煩惱?PG 不會自動選擇索引類型》

《PostgreSQL 自動化後臺並行創建 多索引, 加速導入速度 - pg_parallizator》

《P

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 痞子衡嵌入式半月刊: 第 65 期 這裡分享嵌入式領域有用有趣的項目/工具以及一些熱點新聞,農曆年分二十四節氣,希望在每個交節之日準時發佈一期。 本期刊是開源項目(GitHub: JayHeng/pzh-mcu-bi-weekly),歡迎提交 issue,投稿或推薦你知道的嵌入式那些事兒。 上期回顧 ...
  • NFS: Network File System 網路文件系統,是一個文件系統,不是一種協議類型。使用 NFS,用戶和程式可以像訪問本地文件一樣訪問遠端系統上的文件。 說明: NFS是內核提供的一個功能,文件系統的管理不是由應用程式管理,而是操作系統內核在管理。 硬碟上常見的文件系統:ext4、xf ...
  • topaz clean 3 Mac版是款簡單實用的去處圖像噪點的濾鏡插件;它擁有非常獨特的演算法,可以支持用戶快速的去除大面積或者不相同種類靜態圖片還是那個面的噪點,支持進行細節圖像的保留;還擁有可以將照片快速的變成手會風格的圖片,使您的圖片更加的具有真實性。 詳情:Topaz Clean 3 for ...
  • Bomb Lab 引言:主要任務是“拆炸彈”。所謂炸彈,其實就是一個二進位的可執行文件,要求輸入六個字元串,每個字元串對應一個phase。如果字元串輸入錯誤,系統就會提示BOOM!!!解決這次實驗需要將二進位文件反彙編,通過觀察理解彙編語言描述的程式行為來猜測符合條件的字元串。可以看出該可執行程式要 ...
  • 前言:在zookeeper學習的時候,執行jsp命令查看zookpper運行狀態的時候發現報錯: -bash: jps: command not found 翻閱了一大批文章,不是東拼西湊,就是缺斤少兩,於是乎,本人萌生了第一次寫博客的想法,復盤的同時,順便記錄一下此次踩坑的經過,開始吧,GOGOG ...
  • 創建/更新存儲過程 基礎基礎用法 創建/修改無參存儲過程 CREATE OR REPLACE PROCEDURE procedure_name [IS|AS] --聲明全局變數(可選) BEGIN --存儲過程的執行體 END; --也可以寫成 END procedure_name; 創建/修改攜參 ...
  • 1.創建表 char 和 varchar 如何選擇? char 適用於數長度不會發生改變的時候,是定長的,例如:性別,生日varchar 當一個欄位數據長度不確定,例如:簡介、姓名、等都是採用varcharchar是直接開闢一定長度的空間,varchar是根據存儲數據的長度動態的開闢空間! 測試案例 ...
  • Mac上哪款PostgreSQL資料庫管理工具好用?PostgreSQL Mac版推薦給大家,它是一個現代化的PostgreSQL客戶端,提供了一個易於使用的界面,使Postgres更容易為新手和專家所操作。 詳情:Postico for Mac(PostgreSQL資料庫管理工具) Postico ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...