[TOC] 4、Modifying Your Data(修改數據) Elasticsearch 提供了近實時的操縱數據和搜索的能力。 預設情況下,從索引/更新/刪除數據到在搜索結果中顯示數據會有 1 秒的延遲(刷新間隔)。 這是與其他平臺(如SQL) 的一個重要區別,在SQL中,數據在事務完成後立即 ...
4、Modifying Your Data(修改數據)
Elasticsearch 提供了近實時的操縱數據和搜索的能力。預設情況下,從索引/更新/刪除數據到在搜索結果中顯示數據會有 1 秒的延遲(刷新間隔)。這是與其他平臺(如SQL) 的一個重要區別,在SQL中,數據在事務完成後立即可用。
4.1 Indexing/Replacing Documents(索引/替換 文檔)
我們先前見過如何索引單個文檔。讓我們再次調用該命令 :
PUT /customer/_doc/1?pretty
{
"name": "John Doe"
}
同樣,上面將指定的文檔索引到customer
索引中,且該文檔的ID為1。如果我們再使用不同(或相同)的文檔執行上述命令,ElasticSearch將在現有文檔的基礎上替換(即重新索引)一個ID為1的新文檔:
PUT /customer/_doc/1?pretty
{
"name": "Jane Doe"
}
上面將 ID 為 1 的文檔的name
從“John Doe”
改成“Jane Doe”
。如果使用的是不同的 ID,那麼將為新文檔編製索引,並且索引中已有的文檔將保持不變。
PUT /customer/_doc/2?pretty
{
"name": "Jane Doe"
}
上面將索引一個 ID 為 2 的新文檔。
在索引時,ID 是可選的。如果沒有指定id,Elasticsearch 將生成一個隨機 ID,然後使用它去索引文檔。ElasticSearch生成的實際ID(或在前面的示例中顯式指定的任何內容)作為索引API調用的一部分返回。
該例子演示了在沒有明確的 ID 的情況下如何去索引一個文檔 :
POST /customer/_doc?pretty
{
"name": "Jane Doe"
}
註意,在上述的情況下,我們使用了 POST 而不是 PUT,因為我們沒有指定 ID。
4.2 Updating Documents(更新文檔)
除了可以索引和替換文檔之外,我們也可以更新文檔。不過,請註意Elasticsearch實際上並不是對指定的文檔進行更新。每當我們做一次更新,Elasticsearch都會刪除舊文檔,然後索引一個新文檔,並一次性對其應用更新。
下例演示了將name
欄位更改為“Jane Doe”
來更新ID為1的舊文檔:
POST /customer/_update/1?pretty
{
"doc": { "name": "Jane Doe" }
}
下例演示了將name
欄位更改為“Jane Doe”
來更新ID為1的舊文檔,並同時向其添加age
欄位:
POST /customer/_update/1?pretty
{
"doc": { "name": "Jane Doe", "age": 20 }
}
也可以使用簡單的scripts(腳本)來執行更新。下例演示了使用scripts來將 age
增加 5 :
POST /customer/_update/1?pretty
{
"script" : "ctx._source.age += 5"
}
在上面的例子中,ctx._source
代表當前將被更新的源文檔。
Elasticsearch提供了在給定查詢條件(如SQL UPDATE-WHERE語句)下更新多個文檔的功能。請參閱docs-update-by-query API
4.3 Deleting Documents(刪除文檔)
刪除文檔是很簡單的,下例演示瞭如何刪除ID 為 2 的 customer(的文檔)。
DELETE /customer/_doc/2?pretty
請看 Delete By Query API 以刪除指定查詢匹配到的所有文檔。
值得註意的是,直接刪除整個索引比使用Delete By Query API更有效。
4.4 Batch Processing(批處理)
除了可以索引,更新,和刪除單個文檔之外,Elasticsearch 還提供了使用 _bulk API 來執行上面任何操作的批量方式的能力。這個功能是非常重要,它提供了一種非常有效的機制,可以儘可能減少網路返回且儘可能快的執行多個操作。
舉一個簡單的例子,在下麵一個批量操作中索引了兩個文檔(ID 1 - John Doe 和 ID 2 - Jane Doe):
POST /customer/_bulk?pretty
{"index":{"_id":"1"}}
{"name": "John Doe" }
{"index":{"_id":"2"}}
{"name": "Jane Doe" }
下例使用一個批量操作更新了第一個文檔(ID 為 1),刪除了第二個文檔(ID 為 2) :
POST /customer/_bulk?pretty
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}
請註意上面的刪除操作,在它後面沒有相關的源文檔,因為刪除操作只需要根據文檔的 ID 來刪除。
Bulk API不會因其中一個操作失敗而失敗。如果單個操作因任何原因失敗,bulk操作將繼續處理它後面的其他操作。當Bulk API返回時,它將為每個操作提供一個狀態(按照發送的順序),以便您可以檢查特定操作是否失敗。