DTSE Tech Talk 第18期丨統計信息大揭秘,數倉SQL執行優化之密鑰

来源:https://www.cnblogs.com/huaweiyun/archive/2023/01/18/17059803.html
-Advertisement-
Play Games

摘要:華為雲EI DTSE技術佈道師王躍,針對統計信息對於查詢優化器的重要性,GaussDB(DWS)最新版本的analyze當前能力,與開發者和伙伴朋友們展開交流互動,幫助開發者快速上手使用統計信息的自動收集功能。 在本期《統計信息大揭秘——SQL執行優化之密鑰》的主題直播中,我們邀請到華為雲EI ...


摘要:華為雲EI DTSE技術佈道師王躍,針對統計信息對於查詢優化器的重要性,GaussDB(DWS)最新版本的analyze當前能力,與開發者和伙伴朋友們展開交流互動,幫助開發者快速上手使用統計信息的自動收集功能。

在本期《統計信息大揭秘——SQL執行優化之密鑰》的主題直播中,我們邀請到華為雲EI DTSE技術佈道師王躍,針對統計信息對於查詢優化器的重要性,GaussDB(DWS)最新版本的analyze當前能力,與開發者和伙伴朋友們展開交流互動,幫助開發者快速上手使用統計信息的自動收集功能。

為何要重視統計信息收集?

現階段市場上的資料庫產品,基本上都是基於CBO模型的優化器,在基於CBO模型的優化器中,統計信息是生成最優執行計劃的前提,會直接影響到執行計劃的選擇,因此統計信息的及時收集是尤為重要的。

統計信息主要包括“描述表規模的表級統計信息”和“描述列數據特征的列級統計信息”兩部分內容。

王躍從統計數據在優化器中的運用這一角度,向我們展示了統計信息影響表達小估算的原理、進行等值比較、範圍比較、多條件、簡單JOIN代價估算的原理,進一步解釋了統計信息的重要性。

如何收集統計信息

王躍先帶我們簡單瞭解了GaussDB(DWS)的部署架構,說明瞭分散式查詢的執行流程和統計信息收集的執行流程。

基於此,GaussDB(DWS)共有五種統計信息收集的方法,分別是按庫收集、按表收集、按模式收集、按列收集以及多列組合。

GaussDB(DWS)擁有強大的統計信息自動收集能力,通過後臺線程輪詢收集與優化器同步收集兩種方式來實現。王躍建議開發者可以同步開啟兩種方式,以達到最優的收集功能。

此外,還強調了自動收集的閾值控制方法,同時對收集不及時,統計信息可能失效的場景,提出了一種統計信息推算的兜底策略。確保每個查詢都有及時有效的統計信息可用。保證了儘可能最優的執行性能。

華為雲數倉analyze能力

通過“基本功能”,“收集方式”,“準確性”,“可靠性”,“估算增強”,詳細的介紹了華為雲GaussDB(DWS)近年來在統計信息方面的持續耕耘和比較有亮點的特色功能。

GaussDB(DWS)在analyze的各個執行過程中都進行了精心打造。統計信息是基於對目標數據的採樣生成的,所以準確性才是統計信息的關鍵。

  1. 樣本數據能不能代表全表數據特征?
  2. 如何找到一個恰當的採樣大小,讓統計信息收集的又快又準?
  3. 不同存儲類型的表如何自適應的選取採樣模型?
  4. 記憶體不足時應該如何計算統計信息?

在採樣大小,採樣模型,計算模型等方面的深入投入,GaussDB(DWS)尋找出了這些問題的最佳答案。

最後給出了一鍵式統計信息自動收集的最優配置,讓用戶不再擔心統計信息忘記收集的煩惱,幫助開發者專註於自己業務領域,減少統計信息忘收集的困擾。

統計信息常見問題

我們知道了GaussDB(DWS)的統計信息自動收集功能很強大,那我們接下來更關心的是如何檢測它的使用效果,如何知道收集的進度和方式。

如何判斷統計信息是否失效,給用戶提供了三種簡單快速識別統計信息未收集的方法:

  1. 已知SQL執行慢,看是否有未收集統計信息的表;
  2. 批量作業執行慢,哪些SQL是沒收統計信息;
  3. 通過日誌查找歷史未收集統計信息的表。

analyze易運維,通過非常巧妙的方法,將analyze每一步的執行過程和運行模式,詳細的展示到活躍會話視圖和線程等待視圖,王躍也在最後列舉了一些使用者最常問到關於analyze的幾個TOP問題。

歡迎感興趣的開發者們收看我們的直播回放,瞭解更多~

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 牛牛剛剛出生,嗷嗷待哺,一開始他只能學說簡單的數字,你跟他說一個整數,他立刻就能學會。輸入一個整數,輸出這個整數。 ...
  • 本篇文章,我們就一起聊一聊如何來更好的使用緩存,探尋下如何降低緩存交互過程的性能損耗、如何壓縮緩存的存儲空間占用、如何保證多個操作命令原子性等問題的解決策略,讓緩存在項目中可以發揮出更佳的效果。 ...
  • C++11 智能指針 shared_ptr Written on 2023-01-16 個人學習智能指針記錄合集: C++11 智能指針 C++11 智能指針 shared_ptr C++11 智能指針 unique_ptr C++11 智能指針 weak_ptr std::shared_ptr 共 ...
  • 前言 用.net6開發一個Winform程式,處理Excel文件,並把結果導出Excel文件。 要用到兩個演算法,一是turf.js庫的booleanPointInPolygon方法,判斷經緯度坐標是否在區域內;二是經緯度糾偏演算法,因為對方給的區域坐標集合有偏移,需要糾偏。 這兩個演算法,網上找C#的實 ...
  • 作者:小牛呼嚕嚕 | https://xiaoniuhululu.com 電腦內功、JAVA底層、面試、職業成長相關資料等更多精彩文章在公眾號「小牛呼嚕嚕」 大家好,我是呼嚕嚕。我們都知道現代電腦採用 0 和 1 組成的二進位,來表示所有的信息。那大家是不是有時候會有這些疑問:為什麼電腦採用了 ...
  • 前言 我們在學習 51 單片機的過程中會用到延時,比如一個簡單的流水燈就需要延時來控制依次點亮的時間,或者一些模塊在單片機發出讀數據指令後,需要延時幾十微秒才可以讀出數據等等,這些都離不開延時,所以我們需要一個精準的延時函數來滿足我們的需求。 本篇介紹一個最簡單並且延時最精準的 51 單片機延時函數 ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: 葉金榮 文章來源:GreatSQL社區原創 如何快速臨時禁止某賬戶登入 角色ROLES管理需要先激活 關於授權的其他幾點補充 如何複製/復用賬戶 ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: JennyYu 文章來源:GreatSQL社區原創 前言 兩表使用nest loop(以下簡稱NL)方式進行連接,小表驅動大表效率高,這似乎是大 ...
一周排行
    -Advertisement-
    Play Games
  • 一:背景 1. 講故事 年前遇到了好幾例托管堆被損壞的案例,有些運氣好一些,從被破壞的托管堆記憶體現場能觀測出大概是什麼問題,但更多的情況下是無法做出準確判斷的,原因就在於生成的dump是第二現場,借用之前文章的一張圖,大家可以理解一下。 為了幫助更多受此問題困擾的朋友,這篇來整理一下如何 快狠準 的 ...
  • 前言 .NET6 開始,.NET Croe API 項目取消了 Startup.cs 文件,在 Program.cs 文件的 Main 函數中完成服務的註冊和中間件管道的管理。但當我們項目引入更多包的時候,Program.cs 文件也會看起來很臃腫。 而且,我們不只會有一個後端項目,為了方便快速創建 ...
  • 目錄 背景 get 與 post 的區別 所有介面都用 post 請求? 背景 最近在逛知乎的時候發現一個有趣的問題:公司規定所有介面都用 post 請求,這是為什麼? 看到這個問題的時候其實我也挺有感觸的,因為我也曾經這樣問過我自己。在上上一家公司的時候接到一個項目是從零開始搭建一個微服務,當時就 ...
  • *以下內容為本人的學習筆記,如需要轉載,請聲明原文鏈接 微信公眾號「englyf」https://mp.weixin.qq.com/s/2GFLTstDC7w6u3fTJxflNA 本文大概 1685 個字,閱讀需花 6 分鐘內容不多, 但也花了一些精力如要交流, 歡迎關註我然後評論區留言 謝謝你的 ...
  • 在新版本的pandas中,上述代碼會引起警告,建議改成SQLAlchemy connectable(engine/connection),後續代碼將引入這種升級的連接方式。 ...
  • 幾乎所有的高級編程語言都有自己的垃圾回收機制,開發者不需要關註記憶體的申請與釋放,Python 也不例外。Python 官方團隊的文章 https://devguide.python.org/internals/garbage-collector 詳細介紹了 Python 中的垃圾回收演算法,本文是這篇 ...
  • 如果您想查找高於或低於平均值的數字,可以不必計算該平均值,就能查看更高或更低的值。通過Java應用程式,可以自動突出顯示這些數字。除了快速突出顯示高於或低於平均值的值外,您還可以查看高於或低於的值的個數。現在讓我們看看如何在 Java應用程式中實現此操作。 引入jar包 導入方法1: 手動引入。將  ...
  • 第一種方式:使用{} firstDict = {"name": "wang yuan wai ", "age" : 25} 說明:{}為創建一個空的字典對象 第二種方式:使用fromkeys()方法 second_dict = dict.fromkeys(("name", "age")) #valu ...
  • 在golang中可以使用a := b這種方式將b賦值給a,只有當b能進行深拷貝時a與b才不會互相影響,否則就需要進行更為複雜的深拷貝。 下麵就是Go賦值操作的一個說明: Go語言中所有賦值操作都是值傳遞,如果結構中不含指針,則直接賦值就是深度拷貝;如果結構中含有指針(包括自定義指針,以及切片,map ...
  • 本文結合京東監控埋點場景,對解決樣板代碼的技術選型方案進行分析,給出最終解決方案後,結合理論和實踐進一步展開。通過關註文中的技術分析過程和技術場景,讀者可收穫一種樣板代碼思想過程和解決思路,並對Java編譯器底層有初步瞭解。 ...