旭日Follow_24 的CSDN 博客 ,全文地址請點擊: https://mp.csdn.net/postedit/80910082 索引概念: 索引是關係資料庫中用於存放每一條記錄的一種對象,主要目的是加快數據的讀取速度和完整性檢查。建立索引是一項技術性要求高的工作。一般在資料庫設計階段的與數 ...
旭日Follow_24 的CSDN 博客 ,全文地址請點擊:
https://mp.csdn.net/postedit/80910082
索引概念:
索引是關係資料庫中用於存放每一條記錄的一種對象,主要目的是加快數據的讀取速度和完整性檢查。建立索引是一項技術性要求高的工作。一般在資料庫設計階段的與資料庫結構一道考慮。應用系統的性能直接與索引的合理直接有關。
一、Oracle索引
1、索引類型
列出常見常用的幾種索引類型,如下:
非唯一索引(最常用) NonUnique
唯一索引 Unique
點陣圖索引 Bitmap
分區索引 Partitioned
非分區索引 NonPartitioned
正常型B樹 Normal
基於函數的索引 Function-based
2、索引結構
B-tree:
適合與大量的增、刪、改(OLTP);
不能用包含OR操作符的查詢;
適合高基數的列(唯一值多)
典型的樹狀結構;
每個結點都是數據塊;
大多都是物理上一層、兩層或三層不定,邏輯上三層;
葉子塊數據是排序的,從左向右遞增;
在分支塊和根塊中放的是索引的範圍;
Bitmap:
適合與決策支持系統;
做UPDATE代價非常高;
非常適合OR操作符的查詢;
基數比較少的時候才能建點陣圖索引;
樹型結構:
索引頭
開始ROWID,結束ROWID(先列出索引的最大範圍)
BITMAP
每一個BIT對應著一個ROWID,它的值是1還是0,如果是1,表示著BIT對應的ROWID有值
1. b-tree索引
Oracle資料庫中最常見的索引類型是b-tree索引,也就是B-樹索引,以其同名的計算科學結構命名。CREATE INDEX語句時,預設就是在創建b-tree索引。沒有特別規定可用於任何情況。
2. 點陣圖索引(bitmap index)
點陣圖索引特定於該列只有幾個枚舉值的情況,比如性別欄位,標示欄位比如只有0和1的情況。
3. 基於函數的索引
比如經常對某個欄位做查詢的時候是帶函數操作的,那麼此時建一個函數索引就有價值了。
4. 分區索引和全局索引
這2個是用於分區表的時候。前者是分區內索引,後者是全表索引
5. 反向索引(REVERSE)
這個索引不常見,但是特定情況特別有效,比如一個varchar(5)位欄位(員工編號)含值(10001,10002,10033,10005,10016..)
這種情況預設索引分佈過於密集,不能利用好伺服器的並行
但是反向之後10001,20001,33001,50001,61001就有了一個很好的分佈,能高效的利用好並行運算。
6.HASH索引
HASH索引可能是訪問資料庫中數據的最快方法,但它也有自身的缺點。集群鍵上不同值的數目必須在創建HASH集群之前就要知道。需要在創建HASH集群的時候指定這個值。使用HASH索引必須要使用HASH集群。
3、索引原理
若沒有索引,搜索某個記錄時(例如查找name='wish')需要搜索所有的記錄,因為不能保證只有一個wish,必須全部搜索一遍
若在name上建立索引,oracle會對全表進行一次搜索,將每條記錄的name值哪找升序排列,然後構建索引條目(name和rowid),存儲到索引段中,查詢name為wish時即可直接查找對應地方
創建了索引並不一定就會使用,oracle自動統計表的信息後,決定是否使用索引,表中數據很少時使用全表掃描速度已經很快,沒有必要使用索引
4、建立索引的原則
1.如果有兩個或者以上的索引,其中有一個唯一性索引,而其他是非唯一,這種情況下oracle將使用唯一性索引而完全忽略非唯一性索引
2. 至少要包含組合索引的第一列(即如果索引建立在多個列上,只有它的第一個列被where子句引用時,優化器才會使用該索引)
3. 小表不要簡歷索引
4. 對於基數大的列適合建立B樹索引,對於基數小的列適合簡歷點陣圖索引
5. 列中有很多空值,但經常查詢該列上非空記錄時應該建立索引
6. 經常進行連接查詢的列應該創建索引
7. 使用create index時要將最常查詢的列放在最前面
8. LONG(可變長字元串數據,最長2G)和LONG RAW(可變長二進位數據,最長2G)列不能創建索引
9.限製表中索引的數量(創建索引耗費時間,並且隨數據量的增大而增大;索引會占用物理空間;當對錶中的數據進行增加、刪除和修改的時候,索引也要動態的維護,降低了數據的維護速度)
5、索引使用原則
經常檢索排序大表中40%或非排序表7%的行,建議建索引;
為了改善多表關聯,索引列用於聯結;
列中的值相對比較唯一;
取值範圍(大:B*樹索引,小:點陣圖索引);
Date型列一般適合基於函數的索引;
列中有許多空值,不適合建立索引
二、MySQL索引
1、索引類型
單列索引(普通索引,唯一索引,主鍵索引)、組合索引、全文索引、空間索引
單列索引:一個索引只包含單個列,但一個表中可以有多個單列索引。
普通索引:MySQL中基本索引類型,沒有什麼限制,允許在定義索引的列中插入重覆值和空值,純粹為了查詢數據更快一點。
唯一索引:索引列中的值必須是唯一的,但是允許為空值。
主鍵索引:是一種特殊的唯一索引,不允許有空值。
組合索引:在表中的多個欄位組合上創建的索引,只有在查詢條件中使用了這些欄位的左邊欄位時,索引才會被使用,使用組合索引時遵循最左首碼集合。這個如果還不明白,等後面舉例講解時在細說
全文索引,只有在MyISAM引擎上才能使用,只能在CHAR,VARCHAR,TEXT類型欄位上使用全文索引,介紹了要求,說說什麼是全文索引,就是在一堆文字中,通過其中的某個關鍵字等,就能找到該欄位所屬的記錄行,比如有"你是個大煞筆,二貨 ..." 通過大煞筆,可能就可以找到該條記錄。這裡說的是可能,因為全文索引的使用涉及了很多細節,我們只需要知道這個大概意思,如果感興趣進一步深入使用它,那麼看下麵測試該索引時,會給出一個博文,供大家參考。
空間索引:空間索引是對空間數據類型的欄位建立的索引,MySQL中的空間數據類型有四種,GEOMETRY、POINT、LINESTRING、POLYGON。在創建空間索引時,使用SPATIAL關鍵字。要求,引擎為MyISAM,創建空間索引的列,必須將其聲明為NOT NULL。
2、索引原理
在MySQL中,存儲引擎用類似的方法使用索引,其先在索引中查找對應的值,然後根據匹配的索引記錄找到對應的數據行,最後將數據結果集返回給客戶端。
3、索引使用原則
最左首碼匹配原則
mysql會一直向右匹配直到遇到範圍查詢(>、<、between、like)就停止匹配。比如a = 1 and b = 2 and c > 3 and d = 4,如果建立(a,b,c,d)順序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引則都可以用到,a,b,d的順序可以任意調整。
=和in可以亂序
比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意順序,mysql的查詢優化器會幫你優化成索引可以識別的形式。
儘量選擇區分度高的列作為索引
區分度的公式是count(distinct col)/count(*),表示欄位不重覆的比例,比例越大我們掃描的記錄數越少,唯一鍵的區分度是1,而一些狀態、性別欄位可能在大數據面前區分度就是0,那可能有人會問,這個比例有什麼經驗值嗎?使用場景不同,這個值也很難確定,一般需要join的欄位我們都要求是0.1以上,即平均1條掃描10條記錄。
索引列不能參與計算,保持列“乾凈”
比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很簡單,b+樹中存的都是數據表中的欄位值,但進行檢索時,需要把所有元素都應用函數才能比較,顯然成本太大。所以語句應該寫成create_time = unix_timestamp(’2014-05-29’);
儘量的擴展索引,不要新建索引
比如表中已經有a的索引,現在要加(a,b)的索引,那麼只需要修改原來的索引即可。
4、高性能索引列
獨立的列
首碼索引和索引的選擇性
多列索引
選擇合適的索引列順序
聚簇索引
覆蓋索引
使用索引掃描來做排序
冗餘和重覆索引
未使用的索引