04 索引

来源:https://www.cnblogs.com/itiancong/p/18023061
-Advertisement-
Play Games

索引:為了提高數據查詢的效率,就像書的目錄一樣。 索引的常見模型 哈希表 圖中,User2 和 User4 根據身份證號算出來的值都是 N,後面還跟了一個鏈表。假設,這時候你要查 ID_card_n2 對應的名字是什麼,處理步驟就是:首先,將 ID_card_n2 通過哈希函數算出 N;然後,按順序 ...


索引:為了提高數據查詢的效率,就像書的目錄一樣。

索引的常見模型


哈希表

圖中,User2 和 User4 根據身份證號算出來的值都是 N,後面還跟了一個鏈表。假設,這時候你要查 ID_card_n2 對應的名字是什麼,處理步驟就是:首先,將 ID_card_n2 通過哈希函數算出 N;然後,按順序遍歷,找到 User2。

需要註意的是,圖中四個 ID_card_n 的值並不是遞增的,好處是增加新的 User 時速度會很快,只需要往後追加。缺點是,因為不是有序的,所以哈希索引做區間查詢的速度是很慢的。****

哈希表結構適用於只有等值查詢的場景

有序數組

有序數組在等值查詢和範圍查詢場景中的性能就都非常優秀。

要查 ID_card_n2 對應的名字,用二分法就可以快速得到,時間複雜度是 O(log(N))。同時很顯然,這個索引結構也支持範圍查詢。

僅僅看查詢效率,有序數組就是最好的數據結構。但是,在需要更新數據的時候就麻煩了,往中間插入一個記錄就必須得挪動後面所有的記錄,成本太高。

所以,有序數組索引只適用於靜態存儲引擎

N 叉樹

二叉搜索樹的特點是:父節點左子樹所有結點的值小於父節點的值,右子樹所有結點的值大於父節點的值。

如果你要查 ID_card_n2 的話,圖中的搜索順序就是按照 UserA -> UserC -> UserF -> User2 這個路徑得到。時間複雜度是 O(log(N))

為了維持 O(log(N)) 的查詢複雜度,需要保持這棵樹是平衡二叉樹。為了做這個保證,更新的時間複雜度也是 O(log(N))

二叉樹是搜索效率最高的,但是實際上大多數的資料庫存儲卻並不使用二叉樹。其原因是,索引不止存在記憶體中,還要寫到磁碟上


InnoDB 的索引模型

在 MySQL 中,索引是在存儲引擎層實現的。

InnoDB 使用了 B+ 樹索引模型,每一個索引在 InnoDB 裡面對應一棵 B+ 樹

一個主鍵列為 ID 的表,表中有欄位 k,並且在 k 上有索引。

表中 R1~R5 的 (ID,k) 值分別為 (100,1)、(200,2)、(300,3)、(500,5) 和 (600,6),兩棵樹的示例示意圖如下。

InnoDB 的索引組織結構

根據葉子節點的內容,索引類型分為主鍵索引和非主鍵索引。

  • 主鍵索引的葉子節點存的是整行數據。在 InnoDB 里,主鍵索引也被稱為聚簇索引(clustered index)。
  • 非主鍵索引的葉子節點內容是主鍵的值。在 InnoDB 里,非主鍵索引也被稱為二級索引(secondary index)。

基於主鍵索引和普通索引的查詢區別?

  • select * from T where ID=500,即主鍵查詢方式,則只需要搜索 ID 這棵 B+ 樹;
  • select * from T where k=5,即普通索引查詢方式,需要先搜索 k 索引樹,得到 ID 值為 500,再到 ID 索引樹搜索一次。這個過程稱為回表

基於非主鍵索引的查詢需要多掃描一棵索引樹,因此在應用中應該儘量使用主鍵查詢


索引維護

  • 主鍵長度越小,普通索引的葉子節點就越小,普通索引占用的空間也就越小
  • 有業務邏輯的欄位做主鍵,則往往不容易保證有序插入,寫數據成本相對較高。

從性能和存儲空間方面考量,自增主鍵往往是更合理的選擇。

同時適合用業務欄位直接做主鍵的場景是:

  • 只有一個索引;
  • 該索引必須是唯一索引。

由於沒有其他索引,所以也就不用考慮其他索引的葉子節點大小的問題。

這時候優先考慮“儘量使用主鍵查詢”原則,直接將這個索引設置為主鍵,可以避免每次查詢需要搜索兩棵樹。


問:對於 InnoDB 表 T,如果你要重建索引 k,你的兩個 SQL 語句可以這麼寫:

alter table T drop index k;
alter table T add index(k);

如果你要重建主鍵索引,也可以這麼寫:

alter table T drop primary key;
alter table T add primary key(id);

對於上面這兩個重建索引的作法,說出你的理解。

答:為什麼要重建索引。索引可能因為刪除,或者頁分裂等原因,導致數據頁有空洞,重建索引的過程會創建一個新的索引,把數據按順序插入,重建索引使得頁面的利用率最高,也就是索引更緊湊、更省空間

重建索引 k 的做法是合理的,可以達到省空間的目的。但是,重建主鍵的過程不合理。

不論是刪除主鍵還是創建主鍵,都會將整個表重建。所以連著執行這兩個語句的話,第一個語句就白做了。這兩個語句,你可以用這個語句代替 : alter table T engine=InnoDB。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Gif演示 分解步驟 1,使用組件DataGridView 2,使用DataSource來控製表格展示的數據來源(註意:來源需要是DataTable類型) 3,需要用到非同步線程。如果是不控制數據源的話,需要使用UI安全線程;(使用Control.Invoke或Control.BeginInvoke方 ...
  • 今天同事發開中遇到了一個代碼性能優化的問題,原本需求是:從一個資料庫中查詢某個表數據,存放到datatable中,然後遍歷datatable,看這些數據在另一個資料庫的表中是否存在,存在的話就要更新,不存在就要插入。 就這個需求本身來說很簡單,但是隨著數據量的增大,之前通過迴圈遍歷的方式就出現了性能 ...
  • 網關: 一:apisix doc:https://apisix.apache.org/zh/docs/apisix/getting-started/README/ github:https://github.com/apache/apisix 二:Kong github:https://github ...
  • 在實際應用中,富文本隨處可見,如留言板,聊天軟體,文檔編輯,特定格式內容等,在WPF開發中,如何實現富文本編輯呢?本文以一個簡單的小例子,簡述如何通過RichTextBox實現富文本編輯功能,主要實現複製,剪切,粘貼,撤銷,重做,保存,打開,文本加粗,斜體,下劃線,刪除線,左對齊,居中對齊,右對齊,... ...
  • 概述:通過FluentFTP庫,輕鬆在.NET中實現FTP功能。支持判斷、創建、刪除文件夾,判斷文件是否存在,實現上傳、下載和刪除文件。簡便而強大的FTP操作,提升文件傳輸效率。 在.NET中,使用FluentFTP庫可以方便地實現FTP的相關功能。以下是判斷文件夾是否存在、文件夾的創建和刪除、判斷 ...
  • 概述:在C#多線程編程中,合理終止線程是關鍵挑戰。通過標誌位或CancellationToken,實現安全、協作式的線程終止,確保在適當時機終止線程而避免資源泄漏。 應用場景: 在C#多線程編程中,有時需要終止正在運行的線程,例如在用戶取消操作、程式關閉等情況下。 思路: 線程終止通常涉及到合作式終 ...
  • internal class Program { static List<string> list=new List<string>() { "A","B","C","D","A","B","C","D" }; static string hiddenEle1 = string.Empty;//第一 ...
  • 痞子衡嵌入式半月刊: 第 92 期 這裡分享嵌入式領域有用有趣的項目/工具以及一些熱點新聞,農曆年分二十四節氣,希望在每個交節之日準時發佈一期。 本期刊是開源項目(GitHub: JayHeng/pzh-mcu-bi-weekly),歡迎提交 issue,投稿或推薦你知道的嵌入式那些事兒。 上期回顧 ...
一周排行
    -Advertisement-
    Play Games
  • 1、預覽地址:http://139.155.137.144:9012 2、qq群:801913255 一、前言 隨著網路的發展,企業對於信息系統數據的保密工作愈發重視,不同身份、角色對於數據的訪問許可權都應該大相徑庭。 列如 1、不同登錄人員對一個數據列表的可見度是不一樣的,如數據列、數據行、數據按鈕 ...
  • 前言 上一篇文章寫瞭如何使用RabbitMQ做個簡單的發送郵件項目,然後評論也是比較多,也是準備去學習一下如何確保RabbitMQ的消息可靠性,但是由於時間原因,先來說說設計模式中的簡單工廠模式吧! 在瞭解簡單工廠模式之前,我們要知道C#是一款面向對象的高級程式語言。它有3大特性,封裝、繼承、多態。 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 介紹 Nodify是一個WPF基於節點的編輯器控制項,其中包含一系列節點、連接和連接器組件,旨在簡化構建基於節點的工具的過程 ...
  • 創建一個webapi項目做測試使用。 創建新控制器,搭建一個基礎框架,包括獲取當天日期、wiki的請求地址等 創建一個Http請求幫助類以及方法,用於獲取指定URL的信息 使用http請求訪問指定url,先運行一下,看看返回的內容。內容如圖右邊所示,實際上是一個Json數據。我們主要解析 大事記 部 ...
  • 最近在不少自媒體上看到有關.NET與C#的資訊與評價,感覺大家對.NET與C#還是不太瞭解,尤其是對2016年6月發佈的跨平臺.NET Core 1.0,更是知之甚少。在考慮一番之後,還是決定寫點東西總結一下,也回顧一下.NET的發展歷史。 首先,你沒看錯,.NET是跨平臺的,可以在Windows、 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 添加節點(nodes) 通過上一篇我們已經創建好了編輯器實例現在我們為編輯器添加一個節點 添加model和viewmode ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...
  • 類型檢查和轉換:當你需要檢查對象是否為特定類型,並且希望在同一時間內將其轉換為那個類型時,模式匹配提供了一種更簡潔的方式來完成這一任務,避免了使用傳統的as和is操作符後還需要進行額外的null檢查。 複雜條件邏輯:在處理複雜的條件邏輯時,特別是涉及到多個條件和類型的情況下,使用模式匹配可以使代碼更 ...
  • 在日常開發中,我們經常需要和文件打交道,特別是桌面開發,有時候就會需要載入大批量的文件,而且可能還會存在部分文件缺失的情況,那麼如何才能快速的判斷文件是否存在呢?如果處理不當的,且文件數量比較多的時候,可能會造成卡頓等情況,進而影響程式的使用體驗。今天就以一個簡單的小例子,簡述兩種不同的判斷文件是否... ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...