索引的重要性_ZenDei技術網路在線

前面很多篇不管CPU、記憶體、磁碟、語句等等等都提到了索引的重要，我想剛剛開始學資料庫的在校學生都知道索引對語句性能的重要性。但他們可能不知道，對語句的重要性就是對系統的重要性！開篇小測驗開篇小測驗下麵這樣一個小SQL 你該怎麼樣添加最優索引你是否一眼就能看出來呢？答案將在文章中逐步揭曉~~ ...

前面很多篇不管CPU、記憶體、磁碟、語句等等等都提到了索引的重要，我想剛剛開始學資料庫的在校學生都知道索引對語句性能的重要性。但他們可能不知道，對語句的重要性就是對系統的重要性！

開篇小測驗

　　下麵這樣一個小SQL 你該怎麼樣添加最優索引

　　兩個表上現在只有聚集索引

　　bigproduct 表上已經有聚集索引 ProductID

　　bigtransactionhistory 表上已經有聚集索引 TransactionID

select p.productnumber,p.reorderpoint,th.Quantity
from bigproduct as p
join bigtransactionhistory as th on th.productid=p.productid and th.TransactionDate > p.SellStartDate
where p.name in ('LL Crankarm1000','ML Crankarm1000') and th.TransactionDate > '2010-01-01'

　　你是否一眼就能看出來呢？

　　答案將在文章中逐步揭曉~~~

簡單粗暴的添加索引

　　看過我前面文章的看官們一定會發現我很喜歡用“簡單粗暴”這個詞，一是因為辭彙量小文筆也差，真心用不出高大上的詞兒！再一個，你們不喜歡簡單粗暴麽~~乾貨最重要，不是麽？

　　首先我們看一下沒有優化前的執行計劃

　　clustered index scan 這其實就是表掃描，不是table scan 只是因為表上有聚集索引

　　可以看出這個查詢倆表都使用了表掃描！　　

　　where 條件添加索引

　　首先大多數人都知道 where 條件中的欄位需要添加索引! 我們添加一下看看效果創建

　　在 bigproduct 表上創建 name 列索引，在bigtransactionhistory表上創建 TransactionDate 列索引。

　　再次執行語句看一下效果！

　　添加where索引以後可以看到以下幾個現象

bigproduct 從原來的clustered index scan 變成 index seek
另外多出來個KEY Lookup(clustered)
bigproduct 上添加的索引起了作用，邏輯讀bigproduct 由 601 變成 10。
bigtransactionhistory 沒啥變化啊還是clustered index scan

　　解釋一下出現的現象：首先一點bigproduct 邊添加的where 條件索引，起到了作用，執行的時候不是全表掃描了，邏輯讀有明顯的下降，出現的 KEY Lookup 是因為選擇（select）的列，在索引中沒有，而需要通過聚集索引再查找一次，再找一次也意味著多一部分開銷！

　　那麼同樣添加了where 條件索引的bigtransactionhistory 表為什麼沒起作用呢？那是因為SQL優化器在選擇計劃的時候認為，不使用TransactionDate 列索引查找效率會更好!

　　真的麽？我們來驗證一下，通過指定選擇索引，來讓優化器選擇索引查找！

　　　強制使用索引以後，可以看出邏輯讀由 14W 變成1961W，語句時間也變得很長，這就是優化器為什麼不選用你加的索引！優化器還是很智能的吧。

　　高能預警：優化器可不是什麼時候都這麼智能的...由於緩存計劃或優化器抽風等原因，也會出現優化器用了這種索引，導致你的語句奇慢，讀飆升直接影響到你的記憶體、磁碟、CPU資源！另外如果這樣一條語句是系統中一條很頻繁運行的語句，你的系統就掛了！沒錯就掛了！這就是開篇拋出的問題就是因為一條語句！

　　消滅Key Lookup 添加select 欄位

　　這就是傳說中的覆蓋索引！

　　　看到執行計劃中存在Key Lookup　而且消耗占比很高，如上面強制索引的計劃，那麼我們就要想到的在索引中包含那些SELECT 的列！如果消耗低，邏輯讀少，如上面bigproduct 表中的Key Lookup 就可以忽略（如果你追求完美，也一樣優化就可以了）。

　　　包含列的圖形化創建：

　　　語句創建就是：

CREATE NONCLUSTERED INDEX TransactionDate
ON [dbo].[bigTransactionHistory] ([TransactionDate])

------INCLUDE 就是包含列
INCLUDE ([ProductID],[Quantity])
GO

　　　下麵我們添加一下看看效果：

　　添加select 索引欄位後可以看出的現象：

優化器自己選擇了index seek
bigtransactionhistory占比最高的Key Lookup消失了
邏輯讀由原來無索引的14W變成1W
bigtransactionhistory表還提示缺少索引？

　　　通過優化索引添加select 欄位，我們看出語句又一次得到了提升 bigtransactionhistory 從表掃描變成索引查找，邏輯讀由14W變成 1W！這是一個質的飛躍啊！

　　那為什麼還提示缺少索引呢？創建一下試試吧！

　　索引再優化加入表關聯列

　　按照提示我們創建索引：和上一個索引的不同 ProductID 列由包含列變成了索引列！

USE [AdventureWorks2012]
GO
CREATE NONCLUSTERED INDEX ProductID_TransactionDate
ON [dbo].[bigTransactionHistory] ([ProductID],[TransactionDate])
INCLUDE ([Quantity])

　　我們看一下效果：

　　再次優化索引以後可以看到以下幾個現象

bigtransactionhistory表還是索引查找index seek
bigtransactionhistory依然沒有了Key Lookup
兩表關聯的hash join 變成了nested loops
並行計劃變成了串列
邏輯讀又從1W 變成18

　　又一次質的飛躍！讀從原來的14W 變成1W 又變成18，這樣大大減少了記憶體和IO的消耗，另外並行計劃也變成了串列，無疑又減少了大量CPU的消耗！語句時間，我想這裡就不用多說了吧？

　　高能預警：這裡所說的hash join，並行變串列，不懂的朋友可以在百度自行學習，這裡只是針對當前語句的情況，不能一概而論！

　　精簡你的索引

　　大家都知道，索引會導致update、insert、delete操作變慢！那麼儘量精簡你的索引就是一個很重要的話題了！

　　上面的優化過程中我們創建了幾個索引，以bigTransactionHistory為例來看一下：

　　　腳本這裡就不貼了，其實我們最後創建的索引 ProductID_TransactionDate包含Quantity 已經包含了前兩個索引，而且可以說無論任何類似語句都使用ProductID_TransactionDate包含Quantity 就可以了！

　　　那麼我們就可以清除前兩個索引！

　　至此語句的優化算是結束了，留下的就是bigproduct 依然有一個Key Lookup可以優化，可以仿照上面的繼續優化，這裡就不細說了。語句只是經過了簡單的索引優化就從一輛2手QQ變成了法拉利，是不是很神奇？

　　這就是索引的重要性！

　 開篇小測試你做對了麽？如果沒做對那麼這麼請你自行模擬一個場景再現本篇的話題吧！

-----------------------------------------------------------------------------------------------------

　　總結：往往一個系統的整體緩慢都是因為索引問題導致的，優化索引是對你系統最簡單的保養！

　　　　　 不要小看一條語句的威力，一條語句足可以讓你的系統徹底無法工作！

　　　　　一個問題隨之而來語句一條一條漫無目的的優化麽？我怎麼找出系統的問題語句？怎麼樣的一個優先順序？

索引的重要性

開篇小測驗

簡單粗暴的添加索引