本篇翻譯的是Elasticsearch官方文檔中的一些技巧,是使用Elasticsearch必不可少的必備知識,並且適用於所有的Rest Api。 返回數據格式化 當在Rest請求後面添加 時,結果會以Json格式化的方式顯示。另外,如果添加 結果會以樹的形式顯示,預設都是Flase. 返回數據的易
本篇翻譯的是Elasticsearch官方文檔中的一些技巧,是使用Elasticsearch必不可少的必備知識,並且適用於所有的Rest Api。
返回數據格式化
當在Rest請求後面添加?pretty
時,結果會以Json格式化的方式顯示。另外,如果添加?format=yaml
結果會以樹的形式顯示,預設都是Flase.
返回數據的易讀性
結尾添加?human=true
,返回的數據會有很好的可讀性,比如:
- time:3600 會顯示為 time:1h
- size:1024 會顯示為 1kb
常用的Date Math
在Elasticsearch中日期數學表達式是很常用的,在查詢中經常會通過它來作為檢索條件,比如range或者daterange。表達式通常會有下麵幾種操作:
- +1h ,表示加上一個一個小時
- -1d,表示減去一天
- /d,表示向一天取整
支持的單位也很多,比如
- y,代表一年
- M,代表一個月
- w,代表一周
- d,代表一天
- h,代表一個小時
- m,代表一分鐘
- s,代表一秒鐘
- ms,代表毫秒
舉個例子:
- now+1h,表示當前時間加上一個小時,即一個小時後
- now+1h+1m,表示當前時間加上一個小時零一分鐘,即一個小時一分鐘後
- now+1h/d,表示當前時間加上一個小時,並向一天取整。
- 2015-01-01||+1M/d,2015-01-01加上一個月,並向一天取整
返回的內容過濾
有時候我們可能並不想返回所有的數據,因為這樣會浪費一定的空間和時間,因此需要對查詢返回的結果進行過濾。所有的API都接受一個參數——filter_path,這個參數支持逗號分隔,可以同時填寫多個值。
例如,如果只想要返回查詢的時間、事件的id和分值,可以像下麵這樣:
curl -XGET 'localhost:9200/_search?pretty&filter_path=took,hits.hits._id,hits.hits._score'
{
"took" : 3,
"hits" : {
"hits" : [
{
"_id" : "3640",
"_score" : 1.0
},
{
"_id" : "3642",
"_score" : 1.0
}
]
}
}
也支持*來忽略對某個欄位的過濾:
curl -XGET 'localhost:9200/_nodes/stats?filter_path=nodes.*.ho*'
{
"nodes" : {
"lvJHed8uQQu4brS-SXKsNA" : {
"host" : "portable"
}
}
}
使用**則會忽略最大長度的路徑,與Spring MVC的Url匹配差不多。
curl 'localhost:9200/_segments?pretty&filter_path=indices.**.version'
{
"indices" : {
"movies" : {
"shards" : {
"0" : [ {
"segments" : {
"_0" : {
"version" : "5.2.0"
}
}
} ],
"2" : [ {
"segments" : {
"_0" : {
"version" : "5.2.0"
}
}
} ]
}
},
"books" : {
"shards" : {
"0" : [ {
"segments" : {
"_0" : {
"version" : "5.2.0"
}
}
} ]
}
}
}
}
註意,elasticsearch一般會直接返回一條數據的原始信息,即_source欄位。如果要對_source進行過濾,可以參考下麵的用法:
curl -XGET 'localhost:9200/_search?pretty&filter_path=hits.hits._source&_source=title'
{
"hits" : {
"hits" : [ {
"_source":{"title":"Book #2"}
}, {
"_source":{"title":"Book #1"}
}, {
"_source":{"title":"Book #3"}
} ]
}
}
扁平化
設置flat_settings 為true,會以扁平化的方式返回數據:
{
"persistent" : { },
"transient" : {
"discovery.zen.minimum_master_nodes" : "1"
}
}
關於參數
在Elastcisearch的使用中,往往要接觸到各種數據類型。如果某個欄位設置了固定的類型,那麼當執行查詢或者索引時,一些數據會發生自動的類型轉換。
Boolean
在Es中,false、no、0、off這些值都代表false,其他的值都是true.
Number
所有的API都支持以字元串的方式代表JSON中的數字類型。
Date
支持的類型上面都說過了...
Geo
Geo類型主要用於地圖一類的數據,這裡就先不介紹了。使用方法可以參考
模糊查詢
有的時候一些需要允許一定的模糊度,比如檢索hallo可以查詢到hello,這就要支持模糊查詢。模糊查詢可以使用fuzziness參數,它有點像range:
-fuzziness <= fieldValue <= +fuzziness
並且可以設置一定的模糊度,比如:
- 0,1,2 設置它的編輯距離(levenshtein distance,wiki)
- AUTO,如果設置Auto,那麼會根據字元串的長度而改變
比如,長度為:
0..2
,必須完全匹配3..5
,可以有一個編輯距離的模糊度>5
,可以有兩個編輯距離的模糊度
返回結果——駝峰式
所有的API都接受一個case參數,如果設置為camelCase,那麼所有的名稱都會以駝峰式的形式返回。
查詢的請求體
除了POST請求外,其他的請求時沒有請求體的。這個時候如果要執行查詢,可以把參數放在Url後面。
參考
1 官方文檔
2 編輯距離,wiki百科