小心SQL SERVER 2014新特性——基數評估引起一些性能問題

-Advertisement-

在前陣子寫的一篇博文“SQL SERVER 2014 下IF EXITS 居然引起執行計劃變更的案例分享”里介紹了資料庫從SQL SERVER 2005升級到 SQL SERVER 2014後，發現一個SQL出現性能問題，當時分析後發現執行計劃變了，導致SQL出現了性能問題。但是沒有徹底搞清楚為什麼...

在前陣子寫的一篇博文“SQL SERVER 2014 下IF EXITS 居然引起執行計劃變更的案例分享”里介紹了資料庫從SQL SERVER 2005升級到 SQL SERVER 2014後，發現一個SQL出現性能問題，當時分析後發現執行計劃變了，導致SQL出現了性能問題。但是沒有徹底搞清楚為什麼出現這種情況。當時看到Actual Number of Rows 與Estimated Number of Rows之間的偏差較大（統計信息是最新的），以為是優化器的Bug造成的。其實罪魁禍首是SQL SERVER 2014新特性——基數評估（Cardinality Estimator）所引起的。IF EXISTS完全成了我這個標題黨的替罪羊（罪過罪過）。下麵我再就這個問題展開做一次分析。

查看該SQL語句的實際執行計劃，在屬性裡面我們可以看到CardinalityEstimationModelVersion的值為120，120表示這是新的基數評估，70就是老的基數評估

其實當資料庫的相容級別為120的時候，預設使用新的基數評估。也就是說啟用了新的基數評估，那麼我們現在使用查詢跟蹤標記9481來關閉新的基數評估，使用老的基數評估。

DBCC TRACEON(9481, 1);

GO

啟用跟蹤標記9481後，這個SQL語句的執行計劃變了（可以對比圖4），可以看到CardinalityEstimationModelVersion的值也變為了70。SQL語句一秒就執行完了。這個是因為基數評估出現了偏差導致了不合適的JOIN演算法。

我們對比下麵”圖四：舊執行計劃“，發現其實還是使用Nested Loops，只是外部迴圈表與內部迴圈表變了。

圖四：舊執行計劃

那麼關於新的基數評估（Cardinality Estimator）特性，你想多瞭解一些這方面的知識，可以參考官方文檔Optimizing Your Query Plans with the SQL Server 2014 Cardinality Estimator。中文翻譯版本可以參考SQL Server 2014新特性——基數評估（白皮書閱讀筆記）。下麵是官方文檔關於基數評估出現偏差可能會造成的一些後果：

對於基數評估，每個執行計劃中的運算符都有評估值輸入，這個值決定了優化器使用什麼演算法的操作符，同時也決定了最終的執行計劃。所以如果評估出現偏差，會導致執行計劃選擇出現偏差，導致無法選出一個高效的執行計劃。

評估出現偏差會出現以下結果：

如果評估過小：

1.原本可以使用並行計劃更加有效的，現在使用串列計劃

2.不合適的join演算法

3.不合適的索引選擇，和索引訪問方法

如果評估過大：

1.原本使用串列計劃更加有效，現在使用並行計劃

2.不合適的join演算法

3.不合適的索引選擇，和索引訪問方法

4.過多的記憶體分配

5.記憶體浪費和沒必要的併發

上面這段對應的英文資料如下所示(英語原文作參考,這才是原汁原味的信息):

The individual operator cost models receive the estimates as input. The estimates are a major factor in deciding which physical operator algorithms and plan shapes (such as join orders) are chosen. They also determine the final query plan that executes. Given these critical plan choices, when the cardinality estimation process contains a significantly skewed assumption, this can lead to an inefficient plan choice. This can, in turn, result in degraded performance.

Under estimating rows can lead to memory spills to disk, for example, where not enough memory was requested for sort or hash operations. Under estimating rows can also result in:

The selection of serial plan when parallelism would have been more optimal.
Inappropriate join strategies.
Inefficient index selection and navigation strategies.

Inversely, over estimating rows can lead to:

Selection of a parallel plan when a serial plan might be more optimal.
Inappropriate join strategy selection.
Inefficient index navigation strategies (scan versus seek).
Inflated memory grants.
Wasted memory and unnecessarily throttled concurrency.

Improving the accuracy of row estimates can improve the quality of the query execution plan and, as a result, improve the performance of the query.

其實關於SQL SERVER 2014這個新的基數評估（Cardinality Estimator）特性，確實造成了不少SQL出現性能問題。我們資料庫升級到SQL SERVER 2014後，被這個新特性坑慘了,由於沒有選擇最優的執行計劃，導致一些SQL出現嚴重的性能問題，也間接導致了SQL之間的阻塞（block）急劇上升。開發人員和我都在救火隊員的角色中疲於奔命。最後我不得不採取將資料庫的相容基本從120降為110。從而立馬解決了這個問題。另外從我搜索的一些資料看，SQL SERVER 2014這個新的基數評估（Cardinality Estimator）這個新特性確實還有很多不完善的地方。因為也有不少人都發現升級到SQL Server 2014後出現了性能問題。例如:

MS SQL Server CPU load goes up dramatically when turning on 2014 features by setting compatibility level

Query is slow in SQL Server 2014, fast in SQL Server 2012

參考資料：

http://dba.stackexchange.com/questions/95609/sql-server-performance-is-slow-when-migrated-from-sql-server-2012-to-sql-server

http://www.cnblogs.com/Amaranthus/p/3678647.html

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Spark核心——RDD

Spark中最核心的概念為 RDD（Resilient Distributed DataSets）中文為：彈性分散式數據集，RDD為對分散式記憶體對象的抽象它表示一個被分區不可變且能並行操作的數據集；RDD為可序列化的、可緩存到記憶體對RDD進行操作過後還可以存到記憶體中，下次操作直接把內...
Linux安裝redis

Linux安裝redis。
Linux 伺服器上安裝Webmin

1、登陸到伺服器2、新建一個文件夾來保存webmin，建議在個人用戶下新建。，3、下載Webmin的安裝文件，命令是：wget http://prdownloads.sourceforge.net/webadmin/webmin-1.670.tar.gz到官網下載也可，我喜歡用wget命令來下載。4...
SQL Server 全局變數

SQL Server中所有全局變數都使用兩個@符號作為首碼--1.@@error 最後一個T-SQL錯誤的錯誤號(目的是或得違反約束的錯誤號)insert into Subject values('測試工程師')--違反了約束select @@ERROR --2.@@identity 最後一次插入的...
總結一下SQL的全局變數

SQL Server 2008中的全局變數及其用法T-SQL程式中的變數分為全局變數和局部變數兩類，全局變數是由SQL Server系統定義和使用的變數。DBA和用戶可以使用全局變數的值，但不能自己定義全局變數。下麵詳細總結一下SQL Server 2008中的33個全局變數,並且寫一下示例.@@....
自從學了SQL編程，哪裡不會點哪裡！！！

在學習SQL編程前，先給大家分享幾個段子吧，咱先樂呵樂呵！《桃花庵--程式員版》寫字樓里寫字間，寫字間中程式員；程式人員寫程式，又將程式換酒錢；酒醒只在屏前坐，酒醉還來屏下眠；酒醉酒醒日復日，屏前屏下年復年；但願老死電腦間，不願鞠躬老闆前；賓士寶馬貴者趣，公交自行程式員；別人笑我太瘋癲，我笑自己命...
忘記Mysql的root密碼怎麼辦?

有時候忘掉了mysql的root密碼，這種情況下，如何重置root的密碼呢?找到並編輯mysql的my.ini配置文件，在mysqld節點中添加上skip-grant-table. 如下:[mysqld]# These let you safely reset the lost root passw...
SQL--聯合查詢【Union】

集合運算符是針對兩個集合操作的，兩個集合必須有相同的列數；列具有相同的數據類型（至少能夠隱式轉換的）;最終輸出的集合的列名是，由第一個集合的列名來確定的（可以用來連接多個結果）。註意：聯合【Union】與連接不一樣【Join】。聯合：將多個結果集，合併為一個結果集。Union（去除重覆，相當...