ElasticStack學習（七）：ElasticSearch之Mapping初探

一、Mapping的概念 1、Mapping類似於資料庫中的Schema的定義，作用如下： 1）定義索引中的欄位的名稱； 2）定義欄位的數據類型，例如字元串、數字、日期、布爾等； 3）對每個欄位進行倒排索引的建立及相關配置； 4）Mapping會將Json文檔映射成Lucene所需要的扁平格式； 5 ...

一、Mapping的概念

　　1、Mapping類似於資料庫中的Schema的定義，作用如下：

　　　　1）定義索引中的欄位的名稱；

　　　　2）定義欄位的數據類型，例如字元串、數字、日期、布爾等；

　　　　3）對每個欄位進行倒排索引的建立及相關配置；

　　　　4）Mapping會將Json文檔映射成Lucene所需要的扁平格式；

　　　　5）一個Mapping屬於一個索引的Type，從7.0開始，不需要在Mapping中指定Type信息；

　　2、欄位的數據類型

　　　　1）簡單類型

　　　　　　Text（會增加Keyword子欄位）；

　　　　　　Date；

　　　　　 Integer/Long/Floating；

　　　　　　Boolean；

　　　　　　IP4&IP6；

　　　　　　Keyword；

　　　　2）複雜類型

　　　　　　對象類型；

　　　　　　嵌套類型；

　　　　　　數組（由第一個非空數值的類型所決定）；

　　　　　　空值；

　　　　3）特殊類型（地理信息）

　　　　　　geo_point&geo_shape

二、Dynamic Mapping的概念

　　1、在寫入文檔的時候，如果索引不存在，則會自動創建索引；

　　2、由於上述機制，可以無需手動定義Mapping，ElasticSearch會自動根據文檔信息，推算出欄位的類型；

　　3、但是有時候推算的可能不對，當類型設置的不對時，會導致一些功能無法正常運行，比如範圍內的Range查詢；

三、Mapping與Dynamic Mapping的使用

　　1、推斷欄位的類型

//創建一個文檔
put mapping_test/_doc/1
{
    "id":"100",
    "isvip":false,
    "isadmin":"true",
    "age":18,
    "height":180
}
//查看索引Mapping結構
get mapping_test/_mapping
//刪除索引
delete mapping_test

　　由上圖中可以得出，ElasticSearch基本上可以按照數據推斷出預想的欄位類型，由於isadmin欄位的值是由雙引號所括起來的，所以該欄位被推斷成text類型。

　　2、更改Mapping的欄位類型

　　對於索引後期加入的欄位，可以按照如下情況進行設置：

　　　　1）新增加欄位

　　　　　　a）Dynamic設置為True時，一旦有新增欄位的文檔寫入，Mapping同時會被更新；

　　　　　　b）Dynamic設置為False時，有新增欄位的文檔寫入，Mapping不會被更新，新增欄位的數據也無法被索引，但是信息會出現在_Source中；

　　　　　　c）Dynamic設置成Strict時，文檔寫入失敗；

　　　　2）已有欄位

　　　　　　a）對於已有欄位，一旦已經有數據寫入，就不再支持修改欄位定義。因為Lucene實現的倒排索引，一旦生成後，就不允許修改。

　　　　　　b）如果希望改變已有欄位類型，必須ReIndex，重建索引；

　　　　　　為什麼會這樣？

　　　　　　I）如果修改了欄位的數據類型，會導致已被索引的屬於無法被搜索；

　　　　　　II）正因為如此，對於新增加的欄位，就不會有這個問題的影響；

　　3、對於這幾種情況，我們通過下圖進行演示：

　　　　1）對於dynamic為true時，對於創建的文檔中的某一欄位進行搜索，是可以查詢到的。

　　　　2）將dynamic設置為false，然後新增一個name欄位，然後對其搜索，是無法搜索到的。

　　　　同時mapping中也不存在該欄位。

　　　　但是可以在_Source中看到這個欄位。

　　　　3）將dynamic設置為strict，然後新增一個grade欄位，會發現出現異常。

四、索引Mapping的顯式定義

　　1、Mapping定義的方式有兩種：

　　　　1）可以參考API手冊，純手寫；

　　　　2）為了減少輸入工作量，減少出錯概率，可以依照以下步驟：

　　　　　　a）創建一個臨時的Index，寫入一些樣本數據；

　　　　　　b）通過訪問Mapping API獲取該臨時索引的動態Mapping定義；

　　　　　　c）修改成符合要求的Json，然後創建顯式索引；

　　　　　　d）將臨時索引刪除；

　　2、顯式Mapping定義的語法：

Put Index_Name
{
    "mappings":{
         定義Mapping信息，Json格式
　　　　　"properties":{
　　　　　　　　"column_name":{
　　　　　　　　　　"type":"text"
　　　　　　　　},
　　　　　　　　"column_name":{
　　　　　　　　　　"type":"long"
　　　　　　　　}
　　　　　　　　...
　　　　　　}
     } 
}