Sql Server 聚集索引掃描 Scan Direction的兩種方式------FORWARD 和 BACKWARD

来源:http://www.cnblogs.com/wy123/archive/2016/06/02/5552719.html
-Advertisement-
Play Games

最近發現一個分頁查詢存儲過程中的的一個SQL語句,當聚集索引列的排序方式不同的時候,效率差別達到數十倍,讓我感到非常吃驚 由此引發出來分頁查詢的情況下對大表做Clustered Scan的時候, 不同情況下會選擇FORWARD 或者 BACKWARD差別,以及建立聚集索引時,選擇索引列的排序方式的一 ...


最近發現一個分頁查詢存儲過程中的的一個SQL語句,當聚集索引列的排序方式不同的時候,效率差別達到數十倍,讓我感到非常吃驚

由此引發出來分頁查詢的情況下對大表做Clustered Scan的時候,

不同情況下會選擇FORWARD 或者 BACKWARD差別,以及建立聚集索引時,選擇索引列的排序方式的一些思考

 

廢話不多,上代碼

先建立一張測試表,在Col1上建立聚集索引,寫入100W條數據

create table ClusteredIndexScanDirection
(
    Col1 int identity(1,1),
    Col2 varchar(50),
    Col3 varchar(50),
    Col4 Datetime
)

create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 ASC) 

insert into ClusteredIndexScanDirection values (NEWID(),NEWID(),GETDATE()-RAND()*100)
go 1000000

 

  先直觀地看一下聚集索引掃描時候的FORWARD 和 BACKWARD

 

 

 

 FORWARD

  執行如下分頁查詢,當按照Col4符合2016-5-1和2016-5-15,並且Col1 正序排序的時候

  從執行計劃看,Clustered Index Scan的Scan Direction的方式是BACKWARD

  

 BACKWARD

  執行如下分頁查詢,當按照Col4符合2016-5-1和2016-5-15,並且Col1 倒敘排序的時候

  從執行計劃看,Clustered Index Scan的Scan Direction的方式是BACKWARD

 

  那麼性能上有麽有差別?肯定有,如果沒有,本文也就沒有什麼意義了

  如圖是上述兩種查詢方式在我本機的測試結果,同樣是前1000條數據,因為排序方式不同,其代價也是不同的

  或許你認為邏輯讀,一個是100次,一個是97次,沒多大差別啊,當然這裡這是測試,在實際場景中,這個差別是非常非常大的

  

 

 

 

  對FORWARD和BACKWARD有一個直觀的感受之後,來說說這兩者的區別

  如果瞭解B樹索引結構的話,應該知道聚集索引是以類似於B樹結構的方式來組織的,既然是B樹結構,

  那麼下麵這個圖就不難理解了,

  在索引列按照某事方式排序的情況下,比如

  create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 ASC) 
  或者是
  create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 DESC)

  下麵這張圖分別是FORWARD和BACKWARD兩種Scan direction的實現方式

 

   

                FORWARD

 

                    BACKWARD

  

    Sql Server究竟選中哪種方式,是FORWARD還是BACKWARD,是依賴於你的索引情況和查詢情況的

    以我上面的查詢為例

    如果是按照查詢結果正序排序的方式查詢

    

SELECT *
FROM ClusteredIndexScanDirection WITH (NOLOCK) 
WHERE Col4 >=  '2016-5-1'
	AND Col4  <= '2016-5-15'    
ORDER BY 1 ASC 
OFFSET 0 ROWS FETCH NEXT 1000 ROWS ONLY  

  

    也就是要求查詢結果的排序方式與聚集索引的排序方式一致,聚集索引是ASC的,Sql Server就會採用FORWARD的方式,

    也即是從左到右的Scan方式,找到滿足1000條的數據後返回,查詢終止

    

    如果是按照查詢結果的倒序排序的方式查詢

    

SELECT *
FROM ClusteredIndexScanDirection WITH (NOLOCK) 
WHERE Col4 >=  '2016-5-1'
    AND Col4  <= '2016-5-15'    
ORDER BY 1 DESC
OFFSET 0 ROWS FETCH NEXT 1000 ROWS ONLY  

  

    也就是要求查詢結果的排序方式與聚集索引的排序方式不一致,聚集索引是ASC的,Sql Server就會採用BACKWARD的方式,

    也即是從右到左的Scan方式,找到滿足1000條的數據後返回,查詢終止

    

 

    

    現在就存在一個問題,如果聚集索引是按照ASC正序排列的,也就是說在聚集索引排序一定的情況下

    聚集索引列和查詢條件(CreateDate)上的時候都是遞增的,也就是說,查詢目標數據分佈在B樹的右邊,

    (當然這麼說不嚴謹,物理存儲中並沒有左右的概念,這些都是邏輯上的,並不是完全物理上的概念),

    實際業務中,差不多的意思就是查詢最近N天的數據

    如果查詢結果是按照聚集索引正序排序

    Sql Server 採用FORWARD的方式,也即從左至右,那麼這個查詢就要經歷B樹種從左到右很大一部分數據掃描之後,才能找到所需要的數據

    

    如果查詢結果是按照聚集索引倒敘排序,

    Sql Server 採用BACKWARD的方式,也即從右至左,那麼這個查詢直接從最右邊開始Scan,很快就能找到符合條件的1000條數據。

    

    聚集索引是ASC或者DESC的方式,也會影響到這個查詢,這些概念都是相對的,當然實際場景中,索引情況和查詢條件可能更複雜,

    可見,一個查詢的實現,是通過FORWARD還是BACKWARD,跟聚集索引的排序方式和查詢結果的排序方式,以及查詢條件都有關。

    Sql Server 選擇FORWARD或者BACKWARD,本身都沒有錯,如果出現不同排序方式下性能差別非常大的時候,

    就要註意到是不是,聚集索引的方式與查詢排序方式之間存在類似上述的問題。

    不管是FORWARD或者BACKWARD,避免讓Scan整個表的大部分數據才找到符合條件的數據

      當然實際情況也比例子中複雜很多,還是那句話,具體情況具體分析。

    比如業務系統查詢數據時,排序方式是固定的(比如你網購的訂單信息,總是按照時間倒敘排列的),當然也不排除其他情況

    這就要求我們在創建聚集索引的時候,要考慮到查詢的方式以及排序的方式,慎重地作出選擇。

 

 總結:本文通過聚集索引Scan的兩種方式,FORWARD和BACKWARD,粗淺第分析了表上的聚集索引的排序對查詢時的影響,

    我們在選擇聚集索引排序方式的時候,可以考慮到是不是因為FORWARD和BACKWARD的因素,以便進一步的排查確認。

    

  補充:

      好吧,算我沒說清楚,這裡是按照聚集索引排序,按照非索引欄位查詢,而不是直接按照聚集索引欄位查詢!!!

      我的例子已經寫的很清楚了

      如果聚集索引建立在一個欄位上,也即單欄位作為聚集索引,在非聚集索引欄位上查詢,暫不論這個欄位上有沒有索引

      如果查詢結果的跟聚集索引的排序方式是相同的,那麼就是FORWARD
      如果查詢結果的跟聚集索引的排序方式是相反的,那麼就是BACKWARD

      不管是FORWARD還是BACKWARD,究竟要掃描多大範圍才能找到符合條件的數據,

      取決於上面說的非聚集索引欄位列的數據分佈

      豈能說“ 正序和倒序無差別”?

 


      其實我更想表達的是,因為結果集的排序,會導致在做聚集索引Scan的時候選擇FORWARD或者BACKWARD

      FORWARD還是BACKWARD會對查詢的效率有較大的影響,

      實際應用中太複雜了,當然修改聚集索引的排序方式可以從一定程度上緩解這種問題,我當然測試過,不然也不會亂說

      也有其他方法也可以實現,比如暴力地去修改聚集索引列,或者建立複合聚集索引,辦法也不僅限於此

 

      如果還有不明白的,可以試試下麵這個腳本,可以直接在你機器上執行,看看最後兩個查詢的IO代價

  當然這個例子也比較極端

  

create table ClusteredIndexScanDirection
(
    Col1 int identity(1,1),
    Col2 varchar(50),
    Col3 varchar(50),
    Col4 Datetime
)

create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 ASC) 
 
DECLARE @date datetime,@i int=0
	set @date=GETDATE()
	while @i<1000000
	begin
	insert into ClusteredIndexScanDirection values (NEWID(),NEWID(),DATEADD(MI,@i,GETDATE()))
	set @i=@i+1
end

set statistics io on

SELECT *
FROM ClusteredIndexScanDirection WITH (NOLOCK) 
WHERE Col4 >=  '2016-6-1'
	AND Col4  <= '2016-6-15'    
ORDER BY Col1 ASC 
OFFSET 0 ROWS FETCH NEXT 1000 ROWS ONLY  



SELECT *
FROM ClusteredIndexScanDirection WITH (NOLOCK) 
WHERE Col4 >=  '2016-6-1'
	AND Col4  <= '2016-6-15'    
ORDER BY Col1 DESC 
OFFSET 0 ROWS FETCH NEXT 1000 ROWS ONLY  

  

  

 

 

 

    


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 嵌套Fragments (Nested Fragments), 是在Fragment內部又添加Fragment. 使用時, 主要要依靠宿主Fragment的 `getChildFragmentManager()` 來獲取FragmentManger. 雖然看起來和在activity中添加fragme... ...
  • 判斷欄位是否存在: 判斷索引是否存在: 從這兩段可以看出很多東西,具體可以自己試驗一下 ...
  • 在SQL SERVER中用腳本管理作業,在絕大部分場景下,腳本都比UI界面管理作業要高效、簡潔。打個簡單的比方,如果你要查看作業的運行時長,如果用UI界面查看,100個作業,你就得在歷史記錄裡面至少查看一百次甚至更多,還要記錄、統計作業各個步驟的執行時間。而用腳本,一個查詢就OK了。這篇文章分享一些... ...
  • 先去查詢 show variables like '%func%' ; 這個語句,如果該語句最後輸出的值是OFF 那麼就用下麵的語句去修改就可以:set global log_bin_trust_function_creators = 1 然後再創建,就OK了! ...
  • sql執行計劃:把SQL語句拆分為每個的操作步驟組合,按照一定的順序執行得出結果,查看並看懂執行計劃是調優的關鍵步驟 查看執行計劃的方法 DBMS_XPLAN包 sql*plus AUTO trace V$SQL_PLAN、DBA_HIST_SQL_PLAN ?/rdbms/admin/awrsqr ...
  • ...
  • 現在很多用戶被資料庫的慢的問題所困擾,又苦於花錢請一個專業的DBA成本太高。軟體維護人員對資料庫的瞭解又不是那麼深入,所以導致問題遲遲不能解決,或只能暫時解決不能得到根治。開發人員解決數據問題基本又是搜遍百度各種方法嘗試個遍,可能錯過診斷問題的最佳時機又可能嘗試一堆方法最後無奈放棄。 本系列文章主要 ...
  • 上一篇我們簡單的介紹了,語句優化的三板斧,大部分語句三板斧過後,就算不成為法拉利也能是個寶馬了。 本篇主要講述幾個常見的系統等待,透過這些等待,看看系統存在什麼問題,怎麼樣解決這些問題。結合系統三巨頭(CPU,記憶體,磁碟)綜合展現系統問題和這些元素的聯繫。 首先我們舉個例子:前文提到了,一個好的SQ ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...