MySQL 筆記整理（11） --怎麼給字元串欄位加索引？

-Advertisement-

筆記記錄自林曉斌（丁奇）老師的《MySQL實戰45講》（本篇內圖片均來自丁奇老師的講解，如有侵權，請聯繫我刪除） 11） --怎麼給字元串欄位加索引？日常工作中的登錄系統，你很可能會使用emai這個欄位。因此也很容易遇到類似這樣的語句：我們知道，如果沒有索引那就只能使用全表掃描。並且MySQL ...

筆記記錄自林曉斌（丁奇）老師的《MySQL實戰45講》

（本篇內圖片均來自丁奇老師的講解，如有侵權，請聯繫我刪除）

11） --怎麼給字元串欄位加索引？

　　日常工作中的登錄系統，你很可能會使用emai這個欄位。因此也很容易遇到類似這樣的語句：

mysql> select *from user where email = 'xxx';

　　我們知道，如果沒有索引那就只能使用全表掃描。並且MySQL是支持首碼索引的，也就是說，你可以頂一個字元串的一部分作為索引。預設地，如果你創建索引的語句不指定首碼長度，那麼索引就會包含整個字元串。由於email欄位通常較長，如果你直接使用email作為索引的話，索引占用的空間就會較大。所以可以採用首碼索引的優勢，比如，建立索引email(6)，每個郵箱欄位只取前6個位元組。但這也會帶來損失，如你可能會增加額外的記錄掃描行數。因為前6位相同的郵箱就沒辦法直接通過eamil的索引來判斷了。因此我們建議使用首碼索引，定義好長度，就可以做到既節省空間，又不用額外增加太多的查詢成本。

首碼索引對覆蓋索引的影響：

　　我們知道，普通索引存儲的是主鍵索引的值，因此，如果你不是select* 而是select id，email就可以不進行回表，也就是覆蓋索引。但此處有一個隱藏的問題，即，如果你使用了email欄位來作索引，沒問題可以利用覆蓋索引的性質來進行快速的查詢。但如果你使用的是首碼索引email(255)，(我們db中的email數據的長度均不超過它)，雖然索引覆蓋了全部長度的email的值，還是不能使用覆蓋索引的性質。因為系統並不確定首碼索引是否截斷了完整的信息，因此必須進行回表。

其他方式：

　　當然，你也可能會遇到欄位的首碼區分度不夠高的情況。如我們國家的身份證號，對於同一個城市的人，身份證號前幾位的區分度很低。此時，你可以有別的方式來進行處理如：

使用倒序來存儲數據。
使用Hash欄位存儲。

　　這兩種方式的相同點是都不支持範圍查詢，並且都提供了足夠多的區分度。另外，Hash計算的結果雖有衝突的可能，但概率很低，因此可以認為每次查詢的掃描行數接近1.但使用Hash的方式會額外增加計算的消耗以及額外的存儲空間的消耗。

上期問題：

　　如果沒有session A的配合，只是單獨執行 delete from t; call idata()； explain這三條語句，會看到explain結果中rows欄位其實還是再10000左右，即使用了索引，這是為什麼呢？

　　答：delete語句刪掉了所有的數據，然後通過call idata()插入了10萬行數據，看上去是覆蓋了原來的10萬行。但是，session A開啟了事務並沒有提交，所以之前插入的10w行數據不能刪除，這樣，之前的數據每一行都會有兩個版本，舊版本是delete之前的數據，新版本是標記為delete的語句。這樣索引a上的數據其實是有兩份的。由於Mysql是使用刪除標記來刪除記錄的，並不從索引和數據文件中真正刪除。如果delete和insert中間的間隔相對較小，purge線程還沒來得及清理記錄。如果主鍵相同的情況下，新insert會沿用delete之前的記錄空間，因此統計信息不變。

問題:

　　如果你要維護學生信息的資料庫，學生登錄名統一是"學號@gamail.com"，學號的規則是十五位的數字，前三位是城市編號，四到六位是學校編號，七到十位是入學年份，最後五位是順序編號，只考慮登錄驗證的話，你會怎麼設計這個登錄名的索引呢？

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

理解Device Tree Usage

英語原文地址： htttp://devicetree.org/Device_Tree_Usage 本文介紹如何為新的機器或板卡編寫設備樹（Device Tree），它旨在概要性的介紹設備樹概念，以及如何使用它們來描述機器或者板卡。有關設備樹數據格式的完整技術描述，請參閱ePAPR v1.1規範。 ...
mysql讀寫分離——中間件ProxySQL的簡介與配置

mysql實現讀寫分離的方式 mysql 實現讀寫分離的方式有以下幾種：程式修改mysql操作，直接和資料庫通信，簡單快捷的讀寫分離和隨機的方式實現的負載均衡，許可權獨立分配，需要開發人員協助。 amoeba，直接實現讀寫分離和負載均衡，不用修改代碼，有很靈活的數據解決方案，自己分配賬戶，和後端數據 ...
Linux學習系列之一：在centos 7.5上安裝nginx 以及簡單配置

前言：說到Linux我們都知道那是相當相當得重要得啊，在電腦這個行業，開發運維都是離不開它得。我作為一個準畢業生，智商可能不太夠，只能自己笨鳥先飛，自己操作起來咯。俗話說的好，好記性不如難筆頭嘛。而且nginx這個東西也是非常非常的重要，於是我決定安裝nginx，這樣不僅能熟悉linux得命令，學 ...
.Net Core 在Linux伺服器下部署程式--(2). 部署前需要安裝的軟體及SDK

安裝通用軟體 : ping , telnet , lrzsz , zip , wget 安裝ping軟體，用於測試當前伺服器與其他伺服器之間的網路通暢情況，和Windows的Ping類似執行ping的安裝指令 : sudo yum install initscripts 如果當前用戶為非管理員許可權... ...
.Net Core 在Linux伺服器下部署程式--(1). Windows 連接 Linux伺服器

下載Linux伺服器連接軟體，市面上有Putty，FinalShell等，我以FinalShell為例，下載地址為：http://www.hostbuf.com/t/988.html，軟體安裝結束後如下圖所示 : 雙擊FinallShell，打開軟體，界面如下圖所示 : 點開文件夾圖標，選擇SSH... ...
Windows10家庭版運行應用提示”管理員已阻止你運行此應用...“的解決辦法

win10版本家庭中文版：運行應用程式報錯：解決辦法(親試)： 1.進入”控制面板“--”用戶賬戶“--”用戶賬戶“，選擇”更改用戶賬戶控制設置“，選擇最後一項，點擊”確定“按鈕，如下圖： 2.按【win+R】快捷鍵打開運行，輸入gpedit.msc，如下圖：問題：運行後提示找不到gpedit ...
Redis入門教程（二）

推薦閱讀： Redis入門教程（一）https://www.cnblogs.com/jichi/p/10285346.html 5. Redis 的數據結構 5.1 Redis 數據結構介紹 redis是一種高級的key-value的存儲系統, 其中value支持五種數據類型｡ 1､字元串(Stri ...
克隆虛擬機及配置yum源的步驟及講解（Hadoop基礎）

1、克隆虛擬機找一臺需要克隆的虛擬機但虛擬機必須在關機下進行，（建議將前期Linux環境配置完成）在VMware中右鍵虛擬機找到克隆的選項。點擊克隆可以克隆他的快照（提前做快照）或者是克隆當前虛擬機，現在我要克隆他當前虛擬機自己修改一個名字，放到你放置虛擬機的地方，建議不要放置在C盤下 ...