4月份參加騰訊的實習生面試,初試和覆試的時候都被問到資料庫索引的知識,所以很有必要整理一下這方面的知識。 分為三點,為什麼要用資料庫索引,換句話說它的優點有哪些;什麼情況下適合用資料庫索引呢?怎麼創建資料庫索引,索引有哪些特征呢? (一)為什麼要用資料庫索引? (資料庫索引有哪些優點) ——因為,創 ...
4月份參加騰訊的實習生面試,初試和覆試的時候都被問到資料庫索引的知識,所以很有必要整理一下這方面的知識。
分為三點,為什麼要用資料庫索引,換句話說它的優點有哪些;什麼情況下適合用資料庫索引呢?怎麼創建資料庫索引,索引有哪些特征呢?
(一)為什麼要用資料庫索引? (資料庫索引有哪些優點) ——因為,創建索引可以大大提高系統的性能。
- 優點
- 通過創建唯一性索引,可以保證資料庫表中每一行數據的唯一性。
- 可以大大加快 數據的檢索速度,這也是創建索引的最主要的原因。
- 可以加速表和表之間的連接,特別是在實現數據的參考完整性方面特別有意義。
- 在使用分組和排序 子句進行數據檢索時,同樣可以顯著減少查詢中分組和排序的時間。
- 通過使用索引,可以在查詢的過程中,使用優化隱藏器,提高系統的性能。
- 缺點
- 創建索引和維護索引要耗費時間,這種時間隨著數據量的增加而增加。
- 索引需要占物理空間,除了數據表占數據空間之外,每一個索引還要占一定的物理空間,如果要建立聚簇索引,那麼需要的空間就會更大。
- 當對錶中的數據進行增加、刪除和修改的時候,索引也要動態的維護,這樣就降低了數據的維護速度。
補:打個比方,比如在學生表中需要查詢某個學生的學號,沒有索引的情況下,是要一條一條查詢的,直到找到相應的數據,但找到之後,還會繼續遍歷完整個數據表;但是又餓索引之後,會直接去索引文件中匹配位置,直接查看。
(二)什麼情況下使用資料庫索引?
註:索引都是建立在資料庫表中的某些列的上面。因此,在創建索引的時候,應該仔細考慮在哪些列上可以創建索引
- 在經常需要搜索的列上,可以加快搜索的速度;
- 在作為主鍵的列上,強制該列的唯一性和組織表中數據的排列結構;
- 在經常用在連接的列上,這 些列主要是一些外鍵,可以加快連接的速度;
- 在經常需要根據範圍進行搜索的列上創建索引,因為索引已經排序,其指定的範圍是連續的;
- 在經常需要排序的列上創 建索引,因為索引已經排序,這樣查詢可以利用索引的排序,加快排序查詢時間;
- 在經常使用在where子句中的列上面創建索引,加快條件的判斷速度。
(三)哪些情況下不適合用資料庫索引呢?
- 對於那些在查詢中很少使用或者參考的列不應該創建索引。因為,既然這些列很少使用到,因此有索引或者無索引,並不能提高查詢速度。相反,由於增加了索引,反而降低了系統的維護速度和增大了空間需求。
- 對於那 些只有很少數據值的列也不應該增加索引。因為,由於這些列的取值很少,例如人事表的性別列,在查詢的結果中,結果集的數據行占了表中數據行的很大比 例,即需要在表中搜索的數據行的比例很大。增加索引,並不能明顯加快檢索速度。
- 對於那些定義為text, image和bit數據類型的列不應該增加索引。因為,這些列的數據量要麼相當大,要麼取值很少。
- 當修改性能遠遠大於檢索性能時,不應該創建索 引。這是因為,修改性能和檢索性能是互相矛盾的。當增加索引時,會提高檢索性能,但是會降低修改性能。當減少索引時,會提高修改性能,降低檢索性能。因 此,當修改性能遠遠大於檢索性能時,不應該創建索引。
(四)創建索引的方法
創建索引有多種方法,這些方法包括直接創建索引的方法和間接創建索引的方法。
- 直接創建索引,例如使用create index 語句或者使用創建索引嚮導,
- 間接創建索引,例如在表中定義主鍵約束或者唯一性鍵約束時,同時也創建了索引。
雖然,這兩種方法都可以創建索引,但是,它們創建索引的具體內容是有區別的。
- 使用create index語句或者使用創建索引嚮導來創建索引,這是最基本的索引創建方式,並且這種方法最具有柔性,可以定製創建出符合自己需要的索引。在使用這種方式創建索引時,可以使用許多選項,例如指定數據頁的充滿度、進行排序、整理統計信息等,這樣可以優化索引。使用這種方法,可以指定索引的類型、唯一性和複合性,也就是說,既可以創建聚簇索引,也可以創建非聚簇索引,既可以在一個列上創建索引,也可以在兩個或者兩個以上的列上創建索引。
- 通過定義主鍵約束或者唯一性鍵約束,也可以間接創建索引。主鍵約束是一種保持數據完整性的邏輯,它限製表中的記錄不能有相同的主鍵記錄。在創建主鍵約束時,系統自動創建了一個唯一性的聚簇索引。雖然,在邏輯上,主鍵約束是一種重要的結構,但是,在物理結構上,與主鍵約束相對應的結構是唯一性的聚簇索引。換句話 說,在物理實現上,不存在主鍵約束,而只存在唯一性的聚簇索引。同樣,在創建唯一性鍵約束時,也同時創建了索引,這種索引則是唯一性的非聚簇索引。因此, 當使用約束創建索引時,索引的類型和特征基本上都已經確定了,由用戶定製的餘地比較小。
補:索引分為聚簇索引和非聚簇索引兩種,聚簇索引是按照數據存放的物理位置為順序的,而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度,而非聚簇索引對於單行的檢索很快。
註:當在表上定義主鍵或者唯一性鍵約束時,如果表中已經有了使用create index語句創建的標準索引時,那麼主鍵約束或者唯一性鍵約束創建的索引覆蓋以前創建的標準索引。也就是說,主鍵約束或者唯一性鍵約束創建的索引的優先順序高於使用create index語句創建的索引。
(五)索引的特征 ——唯一性索引和複合索引
- 唯一性索引保證在索引列中的全部數據是唯一的,不會包含冗餘數據。(如果表中已經有一個主鍵約束或者唯一性鍵約束,那麼當創建表或者修改表時,SQL Server自動創建一個唯一性索引。然而,如果必須保證唯一性,那麼應該創建主鍵約束或者唯一性鍵約束,而不是創建一個唯一性索引。當創建唯一性索引時,應該認真考慮這些規則:當在表中創建主鍵約束或者唯一性鍵約束時,SQL Server自動創建一個唯一性索引;如果表中已經包含有數據,那麼當創建索引時,SQL Server檢查表中已有數據的冗餘性;每當使用插入語句插入數據或者使用修改語句修改數據時,SQL Server檢查數據的冗餘性:如果有冗餘值,那麼SQL Server取消該語句的執行,並且返回一個錯誤消息;確保表中的每一行數據都有一個唯一值,這樣可以確保每一個實體都可以唯一確認;只能在可以保證實體 完整性的列上創建唯一性索引,例如,不能在人事表中的姓名列上創建唯一性索引,因為人們可以有相同的姓名。)
- 複合索引就是一個索引創建在兩個列或者多個列上。(在搜索時,當兩個或者多個列作為一個關鍵值時,最好在這些列上創建複合索引。當創建複合索引時,應該考慮 這些規則:最多可以把16個列合併成一個單獨的複合索引,構成複合索引的列的總長度不能超過900位元組,也就是說複合列的長度不能太長;在複合索引中,所 有的列必須來自同一個表中,不能跨表建立複合列;在複合索引中,列的排列順序是非常重要的,因此要認真排列列的順序,原則上,應該首先定義最唯一的列,例 如在(col1,col2)上的索引與在(col2,col1)上的索引是不相同的,因為兩個索引的列的順序不同;為了使查詢優化器使用複合索引,查詢語 句中的where子句必須參考複合索引中第一個列;當表中有多個關鍵列時,複合索引是非常有用的;使用複合索引可以提高查詢性能,減少在一個表中所創建的 索引數量。)