資料庫索引是資料庫系統中一個重要的概念,索引也叫做 key ,是一種用於提升資料庫查詢效率的數據結構,我們可以把索引理解成一本書的目錄,通過目錄我們可以快速找到對應章節的內容,同樣的,通過資料庫索引,我們可以快速找到數據表中對應的記錄。 ...
資料庫索引有關的知識,說實在的,真的是很複雜,本來想好好看看這方面的東西,然後寫篇文章詳細談談的,後來發現索引的知識太難太深,要談得全面又詳細真的很難,所以最後還是把自己學到的和想到的變成下麵一個個的問題,希望能對大家幫助!
知識點
問題1:什麼是資料庫索引?
資料庫索引是資料庫系統中一個重要的概念,索引也叫做 key
,是一種用於提升資料庫查詢效率的數據結構,我們可以把索引理解成一本書的目錄,通過目錄我們可以快速找到對應章節的內容,同樣的,通過資料庫索引,我們可以快速找到數據表中對應的記錄。
總而言之,索引就像給數據表建了一個目錄一樣。
問題2:為什麼在使用索引?
1 . 使用索引大大減少了存儲引擎需要掃描的數據量,如果沒有使用索引的話,每查詢一行數據都要對數據表進行掃描,這樣的話會非常慢。
2 . 由於索引已經排好序的,所以對數據表進行 ORDER BY
和 GROUP BY
等操作時,可以很快得到結果。
3 . 索引可以將隨機的 I/O
轉為順序的 I/O
,避免高昂的磁碟 IO
成本,提升查詢效率。
問題3:MySQL索引在哪個模塊中實現的?
MySQL
的索引是在存儲引擎這一層實現的,因此每一種存儲引擎都有不同的實現方式,對同一種索引的處理方式也完成不同。
問題4:為什麼設置了索引卻不起作用?
如果使用以 %
開頭的 LIKE
語句進行模糊匹配,則無法使用索引,如:
SELECT * FROM users WHERE name LIKE '%小張%'; SELECT * FROM users WHERE name LIKE '%小張'; 複製代碼
不過以 %
為結尾則可以使用索引,如:
SELECT * FROM users WHERE name LIKE '張%';
複製代碼
OR
語句前後沒有同時使用索引,比如下麵的語句, 欄位id
有索引,而 欄位name
沒有創建索引,那麼下麵的語句只能全表掃描,無法用到索引:
SELECT * FROM users id = 10 or name='test'
複製代碼
問題5:MySQL索引底層使用什麼數據結構?
在 MySQL
中,大部分情況下,索引都是使用 B-Tree
作為底層數據結構, B-Tree
只是一種泛稱,實際上不同的存儲引擎使用 B-Tree
時,有不同的變種,比如 InnoDB
使用的是 B+Tree
。
另外也有一些特殊的索引結構,比如哈希索引,哈希索引底層則使用的是哈希表,在 MySQL
中,只有 Memory
存儲引擎支持哈希索引。
問題6:什麼情況下數據表不適合創建索引?
1 . 對於用於存儲歸檔歷史數據的且很少用於查詢的數據表,不建議創建索引。
2 . 數據量比較小的數據表,而且未來數據也不會有太大增長的數據,不應該建索引,比如用於保存配置的數據表。
3 . 修改頻繁,且修改性能遠大於查詢性能時,不應該再創建索引。
問題7:什麼是回表?
回表是對Innodb存儲引擎而言的,在 InnoDB
存儲引擎中,主鍵索引的葉子節點存儲的記錄的數據,而普通索引的葉子節點存儲的主鍵索引的地點。
當我們通過主鍵查詢時,只需要搜索主鍵索引的搜索樹,直接可以得到記錄的數據。
當我們通過普通索引進行查詢時,通過搜索普通索引的搜索樹得到主鍵的地址之後,還要再使用該主鍵對主鍵搜索樹進行搜索,這個過程稱為回表。
問題8:聚簇索引與非聚簇索引的區別?
聚簇索引:聚簇索引的順序就是數據的物理存儲順序,並且索引與數據放在一塊,通過索引可以直接獲取數據,一個數據表中僅有一個聚簇索引。
非聚簇索引:索引順序與數據物理排列順序無關,索引文件與數據是分開存放。
問題9:MySQL主鍵索引、唯一索引與普通索引的區別?
設置為主鍵索引的欄位不允許為 NULL
,而且一張數據表只能有一個主鍵索引。
設置為唯一索引的欄位,其欄位值不允許重要。
普通索引可以包含重覆的值,也可以為 NULL
。
問題10:索引可以提高查詢性能,那是不是索引創建越多越好?
索引作為一個數據表的目錄,本身的存儲就需要消耗很多的磁碟和記憶體存儲空間。
並助在寫入數據表數據時,每次都需要更新索引,所以索引越多,寫入就越慢。
尤其是糟糕的索引,建得越多對資料庫的性能影響越大。
問題11:MyISAM與InnoDB在處理索引上有什麼不同?
MyISAM
存儲引擎是非聚族索引,索引與數據是分開存儲的,索引文件中記錄了數據的指針
而 InnoDB
存儲引擎是聚族索引,即索引跟數據是放在一塊的, InnoDB
一般將主鍵與數據放在一塊,如果沒有主鍵,則將 unique key
作為主鍵,如果沒有 unique key
,則自動創建一個 rowid
作為主鍵,其他二級索引葉子指針存儲的是主鍵的位置。
問題12:什麼是索引的最左首碼原則?
MySQL
資料庫不單可以為單個數據列創建索引,也可以為多個數據列創建一個聯合索引,比如:
CREATE TABLE test(
a INT NOT NOT,
b INT NOT NOT,
KEY(a,b)
);
複製代碼
當我們使用下麵的查詢語句時,由於 WHERE
語句中查詢的條件就是聯合索引,所以可以很快查詢到數據。
SELECT * FROM test WHERE a=1 AND b=1;
複製代碼
同樣,下麵的語句也會利用上面創建的聯合索引,這是因為 MySQL
會按照索引創建的順序進行排序,然後根據查詢條件從索引最左邊開始檢測查詢條件是否滿足該索引,由於欄位 a
在最左邊,所以滿足索引。
SELECT * FROM test WHERE a=1;
複製代碼
而使用 欄位b
進行查詢時,則為滿足,因為從最左邊匹配到的是 欄位a
,所以 MySQL
判斷為不滿足索引條件。
SELECT * FROM test WHERE b=1;
複製代碼
從上面例子可以很好地瞭解索引的最左首碼原則,同時也說明瞭索引順序的重要性。
問題13:什麼是覆蓋索引?
如果一個索引中包含查詢所要的欄位時,此時不需要再回表查詢,我們就稱該索引為覆蓋索引。
比如下麵的查詢中,欄位id是主鍵索引,所以可以直接返回索引的值,顯著提升了查詢的性能。
SELECT id FROM users WHERE id BETWEEN 10 AND 20;
複製代碼
小結
當然,上面列出的只是索引的一小部分知識點,有什麼回答不對的地方,歡迎指出。
想要閱讀更多精彩內容,可以關註我的微信公眾號:Java技術zhai,這是我的私人公眾號,專註於Java技術分享,期待你的參與。