> 本文首發於公眾號:Hunter後端 > 原文鏈接:[Python連接es筆記一之連接與查詢es](https://mp.weixin.qq.com/s/smp3VvWD6ChuFVuotQ9_zg) 有幾種方式在 Python 中配置與 es 的連接,最簡單最有用的方法就是定義一個預設的連接,如 ...
本文首發於公眾號:Hunter後端
原文鏈接:Python連接es筆記一之連接與查詢es
有幾種方式在 Python 中配置與 es 的連接,最簡單最有用的方法就是定義一個預設的連接,如果系統不是需要訪問多個集群,最建議的方式就是使用 create_connection
方法創建連接,然後所有的操作都會自動使用這個連接。
以下是本篇筆記目錄:
- 安裝依賴
- 連接
- Search 查詢
- Response 返回結果詳解
1、安裝依賴
我們使用的依賴名稱為 elasticsearch_dsl
,我們這裡使用的 es 版本是 7.2.0,所以安裝方式如下:
pip3 install elasticsearch_dsl==7.2.0
2、連接
預設連接方式
我們可以通過下麵的方式來連接 es:
from elasticsearch_dsl import connections
connections.create_connection(hosts=["localhost"], timeout=20)
或者我們也可以加一個 alias,用作連接的別名,在後面可以很方便的用上:
from elasticsearch_dsl import connections
connections.create_connection(alias="new_conn", hosts=["localhost"], timeout=20)
多集群連接
如果我們想同時連接多個集群,可以使用 configure 方法:
connections.configure(
default={"hosts": "localhost"},
dev={
"hosts": ["example.com:9200"],
"sniff_on_start": True,
}
)
使用別名
當使用多個連接的時候,我們可以使用別名,也就是前面的 alias 參數來指代連接:
s = Search(using="default")
3、Search 查詢
接下來介紹下如何在 Python 中查詢 es 數據。
註意下,當我們安裝 elasticsearch_dsl 依賴的時候,系統會自動為我們安裝 elasticsearch 模塊,我們可以直接引用。
我們預設前面已經設置好了全局的 es 連接,之後的操作都基於這個連接:
from elasticsearch_dsl import connections
connections.configure(
default={"hosts": "localhost:9200"},
)
我們來執行一下查詢和列印操作:
response = Search(using="default").query("match", name="張三豐").execute()
print(response)
可以看到 response 就列印出了我們在之前往 es 的 exam 這個 index 中寫入的數據:
<Response: [<Hit(exam/16): {'name': '張三豐', 'address': '一個蘋果'}>]>
我們先來介紹下執行查詢的操作。
鏈式操作
這個查詢的 API 是鏈式操作,可以允許你鏈接多個操作,比如我們前面的 Search() 後直接跟了 query() 方法,然後直接 execute()。
我們分開執行也是可以的:
s = Search(using="default")
s = s.query("match", name="張三豐")
response = s.execute()
指定 index
在上面的 Search() 方法里,我們通過 using 指定了連接,但是沒有指定 index,那麼就預設搜索的是該連接的全部 index,我們可以通過 index() 函數指定 index,也可以向 Search() 中添加 index 參數來指定 index。
s = Search(using="default", index="exam").query("match", name="張三豐")
response = s.execute()
s = Search(using="default").index("exam").query("match", name="張三豐")
response = s.execute()
轉換 es 查詢語句
如果我們想要查看執行的語句轉換成的 es 的語句,可以使用 to_dict() 方法:
s = Search(using="default", index="exam").query("match", name="張三豐")
print(s.to_dict())
# {'query': {'match': {'name': '張三豐'}}}
刪除語句
前面介紹了 s = Search().query()
的 execute() 是執行,獲取返回結果,to_dict() 是轉換成 es 語句,如果是需要刪除查詢的數據,可以如下操作:
s = Search(using="default").index("exam").query("match", name="張三豐")
s.delete()
4、Response 返回結果詳解
為了詳細查看 response 中的詳細情況,我們可以在 Python 的 shell 中挨個執行下麵的命令,獲得 response 對象,然後再操作 response,當然,前面記得創建 es 的連接:
>>> s = Search(using="default").index("exam").query("match", name="張三豐")
>>> response = s.execute()
對於 response,本身我們可以使用 Python 中的列表的形式來訪問它,來獲取它的數據,比如執行 print(response[0]) 可以看到這條數據本身的信息:
>>> print(response[1])
# <Hit(exam/24): {'name': '張三豐', 'address': '中國湖北省', 'age': 22}>
如果我們查看 type(response)
可以發現它來源於 <class 'elasticsearch_dsl.response.Response'> 定義了一個 iter() 方法,所以我們可以對這個對象使用迭代方法。
在這個方法內部它迭代的其實是 response.hits 屬性,也就是我們 es 查詢返回的數據。
所以我們執行 response[0] 和 response.hits[0] 是等效操作。
獲取總數
因為我們上面的查詢操作沒有設置 size,所以預設最多返回的是 10 條數據,但如果我們想要獲取符合我們查詢條件的總數,我們可以這樣獲取:
count = response.hits.total.value
單條數據詳情
上面介紹了我們可以通過 response[0] 獲得單條數據,對於單條數據,我們還可以獲取更多的詳情信息。
hit = response.hits[0]
如果我們想一次性獲取返回的數據的各個欄位及相應的值,我們可以使用 to_dict() 方法:
hit.to_dict()
# {'name': '張三豐', 'address': '中國', 'age': 21}
獲取單個值,比如 name,也可以直接:
print(hit.name)
也可以獲取數據的 meta 信息,其中包含了這條數據所在的 index,id,匹配分值 score 等:
hit.meta
# {'index': 'exam', 'id': '23', 'score': 0.4700036, 'doc_type'...}
如果想獲取更多後端相關文章,可掃碼關註閱讀: