Oracle 統計信息收集

来源:https://www.cnblogs.com/leohahah/archive/2018/08/03/9413513.html
-Advertisement-
Play Games

官網網址參考: https://docs.oracle.com/cd/B19306_01/appdev.102/b14258/d_stats.htm#CIHBIEII https://docs.oracle.com/cd/B12037_01/server.101/b10759/statements_ ...


官網網址參考:

https://docs.oracle.com/cd/B19306_01/appdev.102/b14258/d_stats.htm#CIHBIEII

https://docs.oracle.com/cd/B12037_01/server.101/b10759/statements_4005.htm#i2150533

https://asktom.oracle.com/pls/asktom/f?p=100:11:::::p11_question_id:5792247321358

https://docs.oracle.com/database/121/TGSQL/tgsql_histo.htm#TGSQL366

查詢表上一次收集統計信息的時間:

select owner,table_name,last_analyzed from dba_tables where owner='SCOTT';

統計信息涉及的視圖:

Column statistics appear in the data dictionary views USER_TAB_COLUMNS, ALL_TAB_COLUMNS, and DBA_TAB_COLUMNS. Histograms appear in the data dictionary views USER_TAB_HISTOGRAMS, DBA_TAB_HISTOGRAMS, and ALL_TAB_HISTOGRAMS; USER_PART_HISTOGRAMS, DBA_PART_HISTOGRAMS, and ALL_PART_HISTOGRAMS; and USER_SUBPART_HISTOGRAMS, DBA_SUBPART_HISTOGRAMS, and ALL_SUBPART_HISTOGRAMS.

收集統計信息主要有2種方法:

1. analyze

analyze可以用來收集表,索引,列以及系統的統計信息和直方圖,以下為一些典型用法:

analyze table scott.emp compute statistics; --收集所有的統計信息和直方圖信息,包括表、列、索引。
analyze table scott.emp compute statistics for table; --收集emp表的統計信息,不含列、索引統計信息和直方圖。
analyze table scott.emp compute statistics for all columns;  --收集所有列的統計信息和直方圖(超大表較耗資源,因為只要列中有非空值,那麼就會收集這個列的統計信息和直方圖)。
analyze table scott.emp compute statistics for all indexed columns;  --收集所有索引列的統計信息和直方圖。
analyze table scott.emp compute statistics for all indexes; --收集所有索引統計信息,不含列的統計信息和直方圖。
analyze table scott.emp compute statistics for columns 列1,列2; --收集2個列的統計信息和直方圖。
analyze index idx_ename delete statistics; --刪除索引idx_ename的統計信息。
analyze table scott.emp delete statistics; --刪除表t1所有的表,列,索引的統計信息和列直方圖。
analyze table scott.emp estimate statistics sample 15 percent for table; --收集emp表的統計信息,以估算模式採樣比例為15%進行收集,不含列、索引統計信息和直方圖。

從語法可以看出,只有指定列統計信息收集時,才會收集相關列的直方圖,此外收集直方圖時for子句還可以加size子句,size的取值範圍是1-254,預設值是75,表示直方圖的buckets的最大數目。而dbms_stats包的size選擇則有:數字|auto|repeat|skewonly選項,但analyze的size只能是數字。

 

關於直方圖:

A histogram is a special type of column statistic that provides more detailed information about the data distribution in a table column. A histogram sorts values into "buckets," as you might sort coins into buckets.

從官網解釋(參考第四個網址)來看,直方圖就是一種特殊的列統計信息,這也與我們上邊的推斷相符,只有列才有直方圖。

這裡貼一個Tom Kyte用於查看analyze後統計信息的SQL:(已稍作改進,僅示例,這種格式的SQL不推薦,原SQL較簡單參考第三個網址)

select t.num_rows as num_rows_in_table, i.index_name, i.num_rows as num_rows_in_index, co.num_analyzed_cols,ch.histogram_cnt
from (select num_rows from user_tables where table_name ='EMP') t,
     (select index_name,num_rows from user_indexes where table_name = 'EMP') i,
     (select count(*) as num_analyzed_cols from user_tab_columns where table_name='EMP' and num_distinct is not null) co,
     (select count(distinct column_name) histogram_cnt from user_tab_histograms where table_name = 'EMP' ) ch;

需要註意的一點是for table選項在某些版本中並不只收集表統計信息,而是連列和索引的統計信息一塊收集了,至於具體哪些版本的表現不同這裡不做深究,使用上述SQL可以輕易的測試出你的analyze和dbms_stats語句到底收集了什麼統計信息和直方圖。

 

2. 調用dbms_stats包

dbms_stats與analyze的區別是:

analyze收集系統內部對象會報錯,而dbms_stats不會

analyze不能正確的收集分區表的統計信息而dbms_stats可以通過指定粒度來實現(granularity)。

analyze不能並行的收集統計信息,而dbms_stats可以(可以加上degree=>4來實現並行度為4的收集)。

Oracle推薦使用dbms_stats來收集統計信息,analyze將會被逐漸拋棄。

dbms_stats中負責收集統計信息的是以下幾個存儲過程:

GATHER_DATABASE_STATS
    --This procedure gathers statistics for all objects in the database.
GATHER_DICTIONARY_STATS 
    --This procedure gathers statistics for dictionary schemas 'SYS', 'SYSTEM' and schemas of RDBMS components.
GATHER_FIXED_OBJECTS_STATS
    --This procedure gathers statistics for all fixed objects (dynamic performance tables).
GATHER_INDEX_STATS 
    --This procedure gathers index statistics. It attempts to parallelize as much of the work as possible. Restrictions are described in the individual parameters. This operation will not parallelize with certain types of indexes, including cluster indexes, domain indexes, and bitmap join indexes. The granularity and no_invalidate arguments are not relevant to these types of indexes.
GATHER_SCHEMA_STATS 
    --This procedure gathers statistics for all objects in a schema.
GATHER_SYSTEM_STATS
    --This procedure gathers system statistics.
GATHER_TABLE_STATS
    --This procedure gathers table and column (and index) statistics. It attempts to parallelize as much of the work as possible, but there are some restrictions as described in the individual parameters.

三個常用Procedure用法詳解:GATHER_SCHEMA_STATS(兩種用法)、GATHER_TABLE_STATS、GATHER_INDEX_STATS

PROCEDURE GATHER_SCHEMA_STATS
 Argument Name          Type            In/Out Default?
 ------------------------------ ----------------------- ------ --------
 OWNNAME            VARCHAR2        IN
 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT
 BLOCK_SAMPLE       BOOLEAN         IN     DEFAULT
 METHOD_OPT         VARCHAR2        IN     DEFAULT
 DEGREE             NUMBER          IN     DEFAULT
 GRANULARITY        VARCHAR2        IN     DEFAULT
 CASCADE            BOOLEAN         IN     DEFAULT
 STATTAB            VARCHAR2        IN     DEFAULT
 STATID             VARCHAR2        IN     DEFAULT
 OPTIONS            VARCHAR2        IN     DEFAULT
 OBJLIST            OBJECTTAB       OUT
 STATOWN            VARCHAR2        IN     DEFAULT
 NO_INVALIDATE      BOOLEAN         IN     DEFAULT
 GATHER_TEMP        BOOLEAN         IN     DEFAULT
 GATHER_FIXED       BOOLEAN         IN     DEFAULT
 STATTYPE           VARCHAR2        IN     DEFAULT
 FORCE              BOOLEAN         IN     DEFAULT
 OBJ_FILTER_LIST    OBJECTTAB       IN     DEFAULT

PROCEDURE GATHER_SCHEMA_STATS
 Argument Name          Type            In/Out Default?
 ------------------------------ ----------------------- ------ --------
 OWNNAME            VARCHAR2        IN
 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT
 BLOCK_SAMPLE       BOOLEAN         IN     DEFAULT
 METHOD_OPT         VARCHAR2        IN     DEFAULT
 DEGREE             NUMBER          IN     DEFAULT
 GRANULARITY        VARCHAR2        IN     DEFAULT
 CASCADE            BOOLEAN         IN     DEFAULT
 STATTAB            VARCHAR2        IN     DEFAULT
 STATID             VARCHAR2        IN     DEFAULT
 OPTIONS            VARCHAR2        IN     DEFAULT
 STATOWN            VARCHAR2        IN     DEFAULT
 NO_INVALIDATE      BOOLEAN         IN     DEFAULT
 GATHER_TEMP        BOOLEAN         IN     DEFAULT
 GATHER_FIXED       BOOLEAN         IN     DEFAULT
 STATTYPE           VARCHAR2        IN     DEFAULT
 FORCE              BOOLEAN         IN     DEFAULT
 OBJ_FILTER_LIST    OBJECTTAB       IN     DEFAULT
 
PROCEDURE GATHER_TABLE_STATS
 Argument Name          Type            In/Out Default?
 ------------------------------ ----------------------- ------ --------
 OWNNAME            VARCHAR2        IN
 TABNAME            VARCHAR2        IN
 PARTNAME           VARCHAR2        IN     DEFAULT
 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT
 BLOCK_SAMPLE       BOOLEAN         IN     DEFAULT
 METHOD_OPT         VARCHAR2        IN     DEFAULT
 DEGREE             NUMBER          IN     DEFAULT
 GRANULARITY        VARCHAR2        IN     DEFAULT
 CASCADE            BOOLEAN         IN     DEFAULT
 STATTAB            VARCHAR2        IN     DEFAULT
 STATID             VARCHAR2        IN     DEFAULT
 STATOWN            VARCHAR2        IN     DEFAULT
 NO_INVALIDATE      BOOLEAN         IN     DEFAULT
 STATTYPE           VARCHAR2        IN     DEFAULT
 FORCE              BOOLEAN         IN     DEFAULT
 
PROCEDURE GATHER_INDEX_STATS
 Argument Name          Type            In/Out Default?
 ------------------------------ ----------------------- ------ --------
 OWNNAME            VARCHAR2        IN
 INDNAME            VARCHAR2        IN
 PARTNAME           VARCHAR2        IN     DEFAULT
 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT
 STATTAB            VARCHAR2        IN     DEFAULT
 STATID             VARCHAR2        IN     DEFAULT
 STATOWN            VARCHAR2        IN     DEFAULT
 DEGREE             NUMBER          IN     DEFAULT
 GRANULARITY        VARCHAR2        IN     DEFAULT
 NO_INVALIDATE      BOOLEAN         IN     DEFAULT
 STATTYPE           VARCHAR2        IN     DEFAULT
 FORCE              BOOLEAN         IN     DEFAULT

GATHER_SCHEMA_STATS參數詳解:(其他存儲過程的參數解釋參見官方頁面,很多參數description都是通用的)

詳見:Table 103-30 GATHER_SCHEMA_STATS Procedure Parameters

一些實際用例:

EXEC DBMS_STATS.GATHER_SCHEMA_STATS('SCOTT',estimate_percent=>80,method_opt=>'FOR ALL COLUMNS SIZE AUTO',degree=>4,cascade=>TRUE);
EXEC DBMS_STATS.GATHER_TABLE_STATS('SCOTT','EMP',estimate_percent=>80,method_opt=>'FOR ALL COLUMNS SIZE AUTO',degree=>4,cascade=>TRUE);
EXEC DBMS_STATS.GATHER_INDEX_STATS('SCOTT','PK_EMP',estimate_percent=>80,degree=>4);

一些特別提示:

  • 雖然method_opt的description中並未提及for table這個選項,但其實這個選項也是有效的,同analyze一樣,這個參數在不同版本的表現也是不一樣的,具體差異也可以輕易的使用本文中提供的SQL觀察到。
  • 如果想使用compute方式收集統計信息,將estimate_percent設為100或者null即可。
  • Oracle有auto optimizer stats collection的自動維護任務定期的收集統計信息,這些任務是預設開啟的,但當資料庫變的很大之後就會引發嚴重的性能問題,建議只保留周末的一個視窗,其他視窗全部關閉。
  • 直方圖統計信息並不是那麼的重要,只有在遇到對傾斜列(skew)的查詢很頻繁時才有用,這種情況並不常見。
  • 不再推薦使用analyze來收集統計信息,除非是做測試或者表很小,dbms_stats的並行度選項能加快收集速度。
  • 對大表採樣收集統計信息時一般採樣比例不需要很大,通常10%到30%即可,如果業務可以提供維護視窗,那100%也沒什麼大不了。
  • 如果要詳細瞭解統計信息收集了什麼內容,可以參考本文提供的網址鏈接和視圖。

關於執行許可權:

To invoke this procedure you must be owner of the table, or you need the ANALYZE ANY privilege. For objects owned by SYS, you need to be either the owner of the table, or you need the ANALYZE ANY DICTIONARY privilege or the SYSDBA privilege.

當然關於許可權還有個取巧的辦法,示例如下:

conn hr/hr
create or replace procedure gather_stats is 
begin  
dbms_stats.gather_table_stats('HR', 'EMPLOYEES'); 
end gather_stats; 
/  
grant select on hr.employees to scott; 
grant execute on gather_stats to scott;  
conn scott/scott  exec hr.gather_stats;

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 小課堂之hbase命令的簡單操作 1、創建一張表 create 表名,列族名 create 't0','cf01' --把單引號去掉? undefined local variable or method `t02' for 在hbase shell當中使用字元串時,需要註意,要加上引號 是否可以使 ...
  • 占座 ...
  • MySQL安裝完成以後,基本操作有:1.創建資料庫 2.刪除資料庫 3.修改資料庫 1.創建資料庫 在MySQL中,創建資料庫的命令為 create database 資料庫名; 其中可在資料庫名前添加 if not exists,表示不重覆創建同名資料庫。 2.刪除資料庫 在已有的資料庫中可選擇一 ...
  • 該文章是基於 Hadoop2.7.6_01_部署 、 Hive-1.2.1_01_安裝部署 進行的 1. 前言 在一個完整的大數據處理系統中,除了hdfs+mapreduce+hive組成分析系統的核心之外,還需要數據採集、結果數據導出、任務調度等不可或缺的輔助系統,而這些輔助工具在hadoop生態 ...
  • 剛處理完“挖礦”事件,在做最後一個MySQL NBU備份的時候,發現從庫有問題,好奇的是怎麼主從狀態異常沒有告警呢?先不管這麼多了,處理了這個問題再完善告警內容。 一、錯誤信息 從庫show slave status \G看到的錯誤信息如下: 二、錯誤原因 這裡看到從庫的io_thread已經終止, ...
  • 思路: 先將取出的值隨機排序,然後在隨機排序的每次取第一條的結果 舉例如下: select * from(select t.code fromTBIZOPS_PROVINCE t ORDER BY DBMS_RANDOM.RANDOM())where rownum < 2;select * from ...
  • 吃雞游戲火了之後,身邊朋友們都在說“大吉大利,今晚吃雞”、“今天你吃雞了嗎?”作為游戲愛好者的達妹本也想加入吃雞大隊,但無奈不瞭解游戲,還手殘! 當然達妹並不認輸,在網上積極搜索攻略,然後達妹就發現!有很多會大數據的技術人員們,用大數據來分析吃雞的數據,得到一份最強吃雞攻略! 下麵就來看看怎麼利用大 ...
  • 隨著國家大數據戰略的實施和人工智慧、雲服務、物聯網等產業的高速發展,大數據成為了2018年最為熱門的職業之一,也成為了人們茶前飯後討論的熱點!經過2018年大數據一個爆炸式的發展,隨後幾年大數據學習潮流已成必然,“超高薪、高大上、前景光明”成為大數據行業的代名詞。 雖然大數據是一個炙手可熱的行業,但 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...