《ElasticSearch6.x實戰教程》之父-子關係文檔

来源:https://www.cnblogs.com/yulinfeng/archive/2019/07/21/11223205.html
-Advertisement-
Play Games

第七章 父 子關係文檔 打虎親兄弟,上陣父子兵。 本章作為 複雜搜索 的鋪墊,介紹父子文檔是為了更好的介紹複雜場景下的ES操作。 在非關係型資料庫資料庫中,我們常常會有表與表的關聯查詢。例如學生表和成績表的關聯查詢就能查出學會的信息和成績信息。在ES中,父子關係文檔就類似於表的關聯查詢。 背景 ES ...


第七章-父-子關係文檔

打虎親兄弟,上陣父子兵。

本章作為複雜搜索的鋪墊,介紹父子文檔是為了更好的介紹複雜場景下的ES操作。

在非關係型資料庫資料庫中,我們常常會有表與表的關聯查詢。例如學生表和成績表的關聯查詢就能查出學會的信息和成績信息。在ES中,父子關係文檔就類似於表的關聯查詢。

背景

ES5.x開始藉助父子關係文檔實現多表關聯查詢,核心是一個索引Index下可以創建多個類型Type。但ES6.x開始只允許一個索引Index下創建一個類型Type,甚至在未來的版本中將會移除創建類型Type。為了繼續支持多表關聯查詢,ES6.x推出了join新類型來支持父子關係文檔的創建。

問題

假設現在有這樣的需求場景:一個博客有多篇文章,文章有標題、內容、作者、日期等信息,同時一篇文章中會有評論,評論有評論的內容、作者、日期等信息,通過ES來存儲博客的文章及評論信息。

此時文章本身就是"父",而評論就是"子",這類問題也可以通過nested嵌套對象實現,大部分情況下netsted嵌套對象和parent-child父子對象能夠互相替代,但他們仍然不同的優缺點。下麵將介紹這兩種數據結構。

nested嵌套對象

一篇文章的數據結構如下圖所示:

{
    "title":"ElasticSearch6.x實戰教程",
    "author":"OKevin",
    "content":"這是一篇水文",
    "created":1562141626000,
    "comments":[{
        "name":"張三",
        "content":"寫的真菜",
        "created":1562141689000
    },{
        "name":"李四",
        "content":"辣雞",
        "created":1562141745000
    }]
}

通過RESTful API創建索引及定義映射結構:

PUT http://localhost:9200/blog
{
    "mappings":{
        "article":{
            "properties":{
                "title":{
                    "type":"text",
                    "analyzer":"ik_smart",
                    "fields":{
                        "keyword":{
                            "type":"keyword",
                            "ignore_above":256
                        }
                    }
                },
                "author":{
                    "type":"text",
                    "analyzer":"ik_smart",
                    "fields":{
                        "keyword":{
                            "type":"keyword",
                            "ignore_above":256
                        }
                    }
                },
                "content":{
                    "type":"text",
                    "analyzer":"ik_smart"
                },
                "created":{
                    "type":"date"
                },
                "comments":{
                    "type":"nested",
                    "properties":{
                        "name":{
                            "type":"text",
                            "analyzer":"ik_smart",
                            "fields":{
                                "keyword":{
                                    "type":"keyword",
                                    "ignore_above":256
                                }
                            }
                        },
                        "content":{
                            "type":"text",
                            "analyzer":"ik_smart",
                            "fields":{
                                "keyword":{
                                    "type":"keyword",
                                    "ignore_above":256
                                }
                            }
                        },
                        "created":{
                            "type":"date"
                        }
                    }
                }
            }
        }
    }
}

插入數據:

POST http://localhost:9200/blog/article
{
    "title":"ElasticSearch6.x實戰教程",
    "author":"OKevin",
    "content":"這是一篇水文",
    "created":1562141626000,
    "comments":[{
        "name":"張三",
        "content":"寫的真菜",
        "created":1562141689000
    },{
        "name":"李四",
        "content":"辣雞",
        "created":1562141745000
    }]
}
POST http://localhost:9200/blog/article
{
    "title":"ElasticSearch6.x從入門到放棄",
    "author":"OKevin",
    "content":"這是一篇ES從入門到放棄文章",
    "created":1562144089000,
    "comments":[{
        "name":"張三",
        "content":"我已入門",
        "created":1562144089000
    },{
        "name":"李四",
        "content":"我已放棄",
        "created":1562144089000
    }]
}
POST http://localhost:9200/blog/article
{
    "title":"ElasticSearch6.x原理解析",
    "author":"專家",
    "content":"這是一篇ES原理解析的文章",
    "created":1562144089000,
    "comments":[{
        "name":"張三",
        "content":"牛逼,專家就是不一樣",
        "created":1562144089000
    },{
        "name":"李四",
        "content":"大牛",
        "created":1562144089000
    }]
}
  1. 查詢作者為“OKevin”文章的所有評論(父查子)
GET http://localhost:9200/blog/article/_search
{
    "query":{
        "bool":{
            "must":[{
                "match":{
                    "author.keyword":"OKevin"
                }
            }]
        }
    }
}

ES結果返回2條作者為"OKevin"的全部數據。

  1. 查詢評論中含有“辣雞”的文章(子查父)
GET http://localhost:9200/blog/article/_search
{
    "query":{
        "bool":{
            "must":[{
                "match":{
                    "author.keyword":"OKevin"
                }
            },{
                "nested":{
                    "path":"comments",
                    "query":{
                        "bool":{
                            "must":[{
                                "match":{
                                    "comments.content":"辣雞"
                                }
                            }]
                        }
                    }
                }
            }]
        }
    }
}

ES確實只返回了包含"辣雞"的數據。

兩次查詢都直接返回了整個文檔數據。

parent-child父子文檔

既然父子文檔能實現表的關聯查詢,那它的數據結構就應該是這樣:

文章數據結構

{
    "title":"ElasticSearch6.x實戰教程",
    "author":"OKevin",
    "content":"這是一篇實戰教程",
    "created":1562141626000,
    "comments":[]
}

評論數據結構

{
    "name":"張三",
    "content":"寫的真菜",
    "created":1562141689000
}

ES6.x以前是將這兩個結構分別存儲在兩個類型Type中關聯(這看起來更接近關係型資料庫表與表的關聯查詢),但在ES6.x開始一個索引Index只能創建一個類型Type,要再想實現表關聯查詢,就意味著需要把上述兩張表揉在一起,ES6.x由此定義了一個新的數據類型——join

通過RESTful API創建索引及定義映射結構:

{
    "mappings":{
        "article":{
            "properties":{
                "title":{
                    "type":"text",
                    "analyzer":"ik_smart",
                    "fields":{
                        "keyword":{
                            "type":"keyword",
                            "ignore_above":256
                        }
                    }
                },
                "author":{
                    "type":"text",
                    "analyzer":"ik_smart",
                    "fields":{
                        "keyword":{
                            "type":"keyword",
                            "ignore_above":256
                        }
                    }
                },
                "content":{
                    "type":"text",
                    "analyzer":"ik_smart"
                },
                "created":{
                    "type":"date"
                },
                "comments":{
                    "type":"join",
                    "relations":{
                        "article":"comment"
                    }
                }
            }
        }
    }
}

重點關註其中的"comments"欄位,可以看到類型定義為join,relations定義了誰是父誰是子,"article":"comment"表示article是父comment是子。

父子文檔的插入是父與子分別插入(因為可以理解為把多個表塞到了一張表裡)。

插入父文檔:

POST http://localhost:9200/blog/article/1
{
    "title":"ElasticSearch6.x實戰教程",
    "author":"OKevin",
    "content":"這是一篇水文",
    "created":1562141626000,
    "comments":"article"
}
POST http://localhost:9200/blog/article/2
{
    "title":"ElasticSearch6.x從入門到放棄",
    "author":"OKevin",
    "content":"這是一篇ES從入門到放棄文章",
    "created":1562144089000,
    "comments":"article"
}
POST http://localhost:9200/blog/article/3
{
    "title":"ElasticSearch6.x原理解析",
    "author":"專家",
    "content":"這是一篇ES原理解析的文章",
    "created":1562144089000,
    "comments":"article"
}

插入子文檔:

POST http://localhost:9200/blog/article/4?routing=1
{
    "name":"張三",
    "content":"寫的真菜",
    "created":1562141689000,
    "comments":{
        "name":"comment",
        "parent":1
    }
}
POST http://localhost:9200/blog/article/5?routing=1
{
    "name":"李四",
    "content":"辣雞",
    "created":1562141745000,
    "comments":{
        "name":"comment",
        "parent":1
    }
}
POST http://localhost:9200/blog/article/6?routing=2
{
    "name":"張三",
    "content":"我已入門",
    "created":1562144089000,
    "comments":{
        "name":"comment",
        "parent":2
    }
}
POST http://localhost:9200/blog/article/7?routing=2
{
    "name":"李四",
    "content":"我已放棄",
    "created":1562144089000,
    "comments":{
        "name":"comment",
        "parent":2
    }
}
POST http://localhost:9200/blog/article/8?routing=3
{
    "name":"張三",
    "content":"牛逼,專家就是不一樣",
    "created":1562144089000,
    "comments":{
        "name":"comment",
        "parent":3
    }
}
POST http://localhost:9200/blog/article/9?routing=3
{
    "name":"李四",
    "content":"大牛",
    "created":1562144089000,
    "comments":{
        "name":"comment",
        "parent":3
    }
}

如果查詢索引數據會發現一共有9條數據,並不是nested那樣將"評論"嵌套"文章"中的。

  1. 查詢作者為“OKevin”文章的所有評論(父查子)
GET http://localhost:9200/blog/article/_search
{
    "query":{
        "has_parent":{
            "parent_type":"article",
            "query":{
                "match":{
                    "author.keyword":"OKevin"
                }
            }
        }
    }
}

ES只返回了comment評論結構中的數據,而不是全部包括文章數據也返回。這是嵌套對象查詢與父子文檔查詢的區別之一——子文檔可以單獨返回

  1. 查詢評論中含有“辣雞”的文章(子查父)
GET http://localhost:9200/blog/artice/_search
{
    "query":{
        "has_child":{
            "type":"comment",
            "query":{
                "match":{
                    "content":"辣雞"
                }
            }
        }
    }
}

ES同樣也只返回了父文檔的數據,而沒有子文檔(評論)的數據。

nested嵌套對象和parent-child父子文檔之間最大的區別,嵌套對象中的"父子"是一個文檔數據,而父子文檔的中的"父子"是兩個文檔數據。這意味著嵌套對象中如果涉及對嵌套文檔的操作會對整個文檔造成影響(重新索引,但查詢快),包括修改、刪除、查詢。而父子文檔子文檔或者父文檔本身就是獨立的文檔,對子文檔或者父文檔的操作並不會相互影響(不會重新索引,查詢相對慢)。
關註公眾號:CoderBuff,回覆“es”獲取《ElasticSearch6.x實戰教程》完整版PDF。
這是一個能給程式員加buff的公眾號 (CoderBuff)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Java面試題經常會問的問題 面試官Q1:請問StringBuffer和StringBuilder有什麼區別? 這是一個老生常談的話題,筆者前幾年每次面試都會被問到,作為基礎面試題,被問到的概率百分之八九十。下麵我們從面試需要答到的幾個知識點來總結一下兩者的區別有哪些? 繼承關係? 如何實現的擴容?... ...
  • 看到一篇非常全面的SQL優化文章,在開發的工作中往往不考慮性能上的缺失(在一開始的時候數據量不大也看不出速度上的區別)。但寫的越多越應該規範一下寫法。 原文鏈接:http://www.jfox.info/SQL-you-hua.html By Lee - Last updated: 星期五, 五月 ...
  • 最近在網上偶然看到此題: 有兩個序列a,b,大小都為n,序列元素的值任意整形數,無序; 要求:通過交換a,b中的元素,使[序列a元素的和]與[序列b元素的和]之間的差最小 經過一番思索,我試著用窮舉法來解一下這道題,大概思路如下: 1、分別求a,b序列元素之和sum_a、sum_b2、算出min = ...
  • 微服務高可用方案 一、微服務的高可用 在註冊中心、配置中心高可用方案之前,瞭解一下註冊中心的工作原理,下麵分為兩個部分來解釋,一是註冊中心和各個微服務的註冊表的獲取與同步,二是註冊中心如何去維護註冊表。 1.1、註冊表的獲取與同步 Eureka Server和Eureka Client之間的關係,通 ...
  • 異常   Java虛擬機異常使用Throwable或其子類的實例來表示,拋異常本質上是程式控制權的一種即時的、非局部的轉換,即從拋出的地方轉換至處理異常的地方。   導致異常的原因 執行了athrow位元組碼指令。 虛擬機同步檢測到程式發生了非正常的執行情況,這 ...
  • \t製表符>>> print('python')python>>> print("python")python>>> print('\tpython') python\n換行符>>> print("Languages:\nPython\nC\nJavaScript")Languages:Python... ...
  • SpringMVC是一個一種基於Java的實現MVC設計模型的請求驅動類型的輕量級web框架 SpringMVC的入門案例 1. 2.導入相關jar包 3,在web.xml中配置前端控制器 4.編寫控制器類 5.開啟掃描註解 6.編寫兩個JSP 首頁 成功頁面 入門案例的流程總結 1.伺服器啟動,加 ...
  • # 電影天堂爬蟲 **今日目標** 爬取電影天堂前30頁最新電影以及下載地址 ```python # 1. 列印程式執行時間 # 2. 數據爬下來後做處理(字元串),定義成字典 # 3. 一條龍: 獲取 -> 調用解析 -> 數據處理 from urllib import request impor... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...