DTSE Tech Talk 第18期丨統計信息大揭秘,數倉SQL執行優化之密鑰

来源:https://www.cnblogs.com/huaweiyun/archive/2023/01/18/17059803.html
-Advertisement-
Play Games

摘要:華為雲EI DTSE技術佈道師王躍,針對統計信息對於查詢優化器的重要性,GaussDB(DWS)最新版本的analyze當前能力,與開發者和伙伴朋友們展開交流互動,幫助開發者快速上手使用統計信息的自動收集功能。 在本期《統計信息大揭秘——SQL執行優化之密鑰》的主題直播中,我們邀請到華為雲EI ...


摘要:華為雲EI DTSE技術佈道師王躍,針對統計信息對於查詢優化器的重要性,GaussDB(DWS)最新版本的analyze當前能力,與開發者和伙伴朋友們展開交流互動,幫助開發者快速上手使用統計信息的自動收集功能。

在本期《統計信息大揭秘——SQL執行優化之密鑰》的主題直播中,我們邀請到華為雲EI DTSE技術佈道師王躍,針對統計信息對於查詢優化器的重要性,GaussDB(DWS)最新版本的analyze當前能力,與開發者和伙伴朋友們展開交流互動,幫助開發者快速上手使用統計信息的自動收集功能。

為何要重視統計信息收集?

現階段市場上的資料庫產品,基本上都是基於CBO模型的優化器,在基於CBO模型的優化器中,統計信息是生成最優執行計劃的前提,會直接影響到執行計劃的選擇,因此統計信息的及時收集是尤為重要的。

統計信息主要包括“描述表規模的表級統計信息”和“描述列數據特征的列級統計信息”兩部分內容。

王躍從統計數據在優化器中的運用這一角度,向我們展示了統計信息影響表達小估算的原理、進行等值比較、範圍比較、多條件、簡單JOIN代價估算的原理,進一步解釋了統計信息的重要性。

如何收集統計信息

王躍先帶我們簡單瞭解了GaussDB(DWS)的部署架構,說明瞭分散式查詢的執行流程和統計信息收集的執行流程。

基於此,GaussDB(DWS)共有五種統計信息收集的方法,分別是按庫收集、按表收集、按模式收集、按列收集以及多列組合。

GaussDB(DWS)擁有強大的統計信息自動收集能力,通過後臺線程輪詢收集與優化器同步收集兩種方式來實現。王躍建議開發者可以同步開啟兩種方式,以達到最優的收集功能。

此外,還強調了自動收集的閾值控制方法,同時對收集不及時,統計信息可能失效的場景,提出了一種統計信息推算的兜底策略。確保每個查詢都有及時有效的統計信息可用。保證了儘可能最優的執行性能。

華為雲數倉analyze能力

通過“基本功能”,“收集方式”,“準確性”,“可靠性”,“估算增強”,詳細的介紹了華為雲GaussDB(DWS)近年來在統計信息方面的持續耕耘和比較有亮點的特色功能。

GaussDB(DWS)在analyze的各個執行過程中都進行了精心打造。統計信息是基於對目標數據的採樣生成的,所以準確性才是統計信息的關鍵。

  1. 樣本數據能不能代表全表數據特征?
  2. 如何找到一個恰當的採樣大小,讓統計信息收集的又快又準?
  3. 不同存儲類型的表如何自適應的選取採樣模型?
  4. 記憶體不足時應該如何計算統計信息?

在採樣大小,採樣模型,計算模型等方面的深入投入,GaussDB(DWS)尋找出了這些問題的最佳答案。

最後給出了一鍵式統計信息自動收集的最優配置,讓用戶不再擔心統計信息忘記收集的煩惱,幫助開發者專註於自己業務領域,減少統計信息忘收集的困擾。

統計信息常見問題

我們知道了GaussDB(DWS)的統計信息自動收集功能很強大,那我們接下來更關心的是如何檢測它的使用效果,如何知道收集的進度和方式。

如何判斷統計信息是否失效,給用戶提供了三種簡單快速識別統計信息未收集的方法:

  1. 已知SQL執行慢,看是否有未收集統計信息的表;
  2. 批量作業執行慢,哪些SQL是沒收統計信息;
  3. 通過日誌查找歷史未收集統計信息的表。

analyze易運維,通過非常巧妙的方法,將analyze每一步的執行過程和運行模式,詳細的展示到活躍會話視圖和線程等待視圖,王躍也在最後列舉了一些使用者最常問到關於analyze的幾個TOP問題。

歡迎感興趣的開發者們收看我們的直播回放,瞭解更多~

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 牛牛剛剛出生,嗷嗷待哺,一開始他只能學說簡單的數字,你跟他說一個整數,他立刻就能學會。輸入一個整數,輸出這個整數。 ...
  • 本篇文章,我們就一起聊一聊如何來更好的使用緩存,探尋下如何降低緩存交互過程的性能損耗、如何壓縮緩存的存儲空間占用、如何保證多個操作命令原子性等問題的解決策略,讓緩存在項目中可以發揮出更佳的效果。 ...
  • C++11 智能指針 shared_ptr Written on 2023-01-16 個人學習智能指針記錄合集: C++11 智能指針 C++11 智能指針 shared_ptr C++11 智能指針 unique_ptr C++11 智能指針 weak_ptr std::shared_ptr 共 ...
  • 前言 用.net6開發一個Winform程式,處理Excel文件,並把結果導出Excel文件。 要用到兩個演算法,一是turf.js庫的booleanPointInPolygon方法,判斷經緯度坐標是否在區域內;二是經緯度糾偏演算法,因為對方給的區域坐標集合有偏移,需要糾偏。 這兩個演算法,網上找C#的實 ...
  • 作者:小牛呼嚕嚕 | https://xiaoniuhululu.com 電腦內功、JAVA底層、面試、職業成長相關資料等更多精彩文章在公眾號「小牛呼嚕嚕」 大家好,我是呼嚕嚕。我們都知道現代電腦採用 0 和 1 組成的二進位,來表示所有的信息。那大家是不是有時候會有這些疑問:為什麼電腦採用了 ...
  • 前言 我們在學習 51 單片機的過程中會用到延時,比如一個簡單的流水燈就需要延時來控制依次點亮的時間,或者一些模塊在單片機發出讀數據指令後,需要延時幾十微秒才可以讀出數據等等,這些都離不開延時,所以我們需要一個精準的延時函數來滿足我們的需求。 本篇介紹一個最簡單並且延時最精準的 51 單片機延時函數 ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: 葉金榮 文章來源:GreatSQL社區原創 如何快速臨時禁止某賬戶登入 角色ROLES管理需要先激活 關於授權的其他幾點補充 如何複製/復用賬戶 ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: JennyYu 文章來源:GreatSQL社區原創 前言 兩表使用nest loop(以下簡稱NL)方式進行連接,小表驅動大表效率高,這似乎是大 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...