全文檢索-Elasticsearch (一) 安裝與基礎概念

来源:https://www.cnblogs.com/qiuguochao/archive/2018/05/21/9043680.html
-Advertisement-
Play Games

Elasticsearch由java開發,所以在搭建時,需先安裝java JDK 幾個基本概念 索引(Index) 一個索引就是含有相似結構或性質特性的文檔的集合,例如用戶信息數據可以作為一個索引,文章信息也可應作為另一個索引。 文檔(Document) 文檔是索引的基本單元,可以理解成關係資料庫表 ...


ElasticSearch是一個基於Lucene的搜索伺服器。它提供了一個分散式多用戶能力的全文搜索引擎,基於RESTful web介面

Elasticsearch由java開發,所以在搭建時,需先安裝java JDK

幾個基本概念

  • 索引(Index)

 一個索引就是含有相似結構或性質特性的文檔的集合,例如用戶信息數據可以作為一個索引,文章信息也可應作為另一個索引。

  • 文檔(Document)

 文檔是索引的基本單元,可以理解成關係資料庫表中的一條記錄,包含了一組屬性信息,同時包含一個唯一標識這一組屬性值的ID,通過該ID可以更新一個文檔,也可以刪除一個文檔。

  • 分片(Shards)和副本(Replicas)

 一個索引進行分割,分成多個片段,每一個片段稱為一個分片,這樣劃分可以很好地管理索引,跨節點存儲, 每個分片本身是一個全功能的完全獨立的“索引”,它可以部署在集群中的任何節點;副本是為了保證一個分片的可用性,冗餘複製存儲,當一個分片對應的數據無法讀取時,可以讀取其副本,正常提供搜索服務。

副本根據官方文檔有以下兩個重要作用

  1. 高可用。它提供了高可用來以防分片或節點宕機。為此,一個非常重要的註意點是絕對不要將一個分片的拷貝放在跟這個分片相同的機器上。
  2. 高併發。它允許你的分片可以提供超出自身吞吐量的搜索服務,搜索行為可以在分片所有的副本中並行執行。
  • 集群(cluster)

一個集群是由一個或多個節點(伺服器)組成的,通過所有的節點一起保存你的全部數據並且提供聯合索引和搜索功能的節點集合。每個集群有一個唯一的名稱標識,預設是“elasticsearch”。這個名稱非常重要,因為一個節點(Node)只有設置了這個名稱才能加入集群,成為集群的一部分。

  • 節點(Node)

 一個節點是一個單一的伺服器,是集群的一部分,存儲數據,並且參與集群的索引和搜索功能。跟集群一樣,節點在啟動時也會被分配一個唯一的標識名稱,這個名稱預設是一個隨機的UUID(Universally Unique IDentifier)。如果你不想用預設的名稱,你可以自己定義節點的名稱。這個名稱對於管理集群節點,識別哪台伺服器對應集群中的哪個節點有重要的作用。

安裝-搭建集群

準備三台伺服器搭建三個集群節點:

192.168.0.101

192.168.0.102

192.168.0.103

之後在官網下載ES,分別為三台伺服器裝上Elasticsearch

 

對於windows伺服器,在官網有兩種格式下載: ZIP和MSI,可以任選

  • ZIP格式安裝:

下載解壓後,直接在bin文件中執行elasticsearch.bat即可運行Elasticsearch,

或是執行elasticsearch-service.bat安裝成服務即可

 

  • MSI格式安裝:

1.運行elasticsearch-6.2.4.msi;出現如圖以下界面,預設目錄或是選擇目錄安裝,下一步

 

 2.可以選擇是否安裝成windows服務,這邊先不選擇,改為手動開啟

3.進行基本配置。下一步

 

 4.先不選任何插件或是分詞器,之後安裝即可

  • 不管是哪種安裝方式,想搭建集群,每個節點還需進入ElasticSearch安裝目錄下config文件夾中,打開elasticsearch.yml進行配置

節點一配置信息:

bootstrap.memory_lock: false 
cluster.name: elasticsearch         #集群名稱,所有節點必須一致,才能自動加入集群
http.port: 9200             #對外通信埠
network.host: 192.168.0.101         #本機IP
node.data: true                #是否為數據節點
node.ingest: true
node.master: true               #是否為候選主節點
node.name: node-1               #節點名稱
path.data: C:\Elasticsearch\data   #索引數據保存目錄
path.logs: C:\Elasticsearch\logs   #日記保存目錄
transport.tcp.port: 9300        #節點間通信埠
discovery.zen.ping.unicast.hosts: ["192.168.0.102:9300", "192.168.0.103:9300"] #設置集群自動發現機器ip集合 ,
discovery.zen.minimum_master_nodes: 2 #
一般用node數/2 + 1。node數不能為偶數 防止腦裂現象
 

 節點二配置信息

bootstrap.memory_lock: false 
cluster.name: elasticsearch         #集群名稱,所有節點必須一致,才能自動加入集群
http.port: 9200              #對外通信埠
network.host: 192.168.0.102         #本機IP
node.data: true                #是否為數據節點
node.ingest: true
node.master: true               #是否為候選主節點
node.name: node-2               #節點名稱
path.data: C:\Elasticsearch\data   #索引數據保存目錄
path.logs: C:\Elasticsearch\logs   #日記保存目錄
transport.tcp.port: 9300        #節點間通信埠
discovery.zen.ping.unicast.hosts: ["192.168.0.101:9300", "192.168.0.103:9300"] #設置集群自動發現機器ip集合 
discovery.zen.minimum_master_nodes: 2 #一般用node數/2 + 1。node數不能為偶數 防止腦裂現象


 節點三配置信息

bootstrap.memory_lock: false 
cluster.name: elasticsearch         #集群名稱,所有節點必須一致,才能自動加入集群
http.port: 9200             #對外通信埠
network.host: 192.168.0.103         #本機IP
node.data: true                #是否為數據節點
node.ingest: true
node.master: true               #是否為候選主節點
node.name: node-3               #節點名稱
path.data: C:\Elasticsearch\data   #索引數據保存目錄
path.logs: C:\Elasticsearch\logs   #日記保存目錄
transport.tcp.port: 9300         #節點間通信埠
discovery.zen.ping.unicast.hosts: ["192.168.0.101:9300", "192.168.0.102:9300"] #設置集群自動發現機器ip集合 ,
discovery.zen.minimum_master_nodes: 2 #一般用node數/2 + 1。node數不能為偶數 防止腦裂現象


  •  分別運行elasticsearch,直接通過chrom應用安裝elasticsearch-head瀏覽器插件,elasticsearch-head可以查看es集群的運行狀態以及數據

結果如下(還未加入任何索引):

 

集群健康值說明:

  1. 綠色:所有的主分片和副本分片都正常可用;
  2. 黃色:所有的主分片可用,但是部分副本分片不可用
  3. 紅色:部分主分片不可用

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • from:從0開始,構建前後端分離應用 1. 一些基本概念 1.1 為什麼要進行單元測試?我自己的理解是 1、能夠快速發現問題。避免衍生BUG的出現 在對一些現有代碼進行修改時,或者修改現有BUG的時候。都有可能對已有的代碼產生影響,產生新的問題。那麼怎麼能避免新問題的產生呢?那就是執行回歸測試,但 ...
  • 回到 DirectX11 使用Windows SDK來進行開發: "http://www.cnblogs.com/X Jun/p/9028764.html" 由於個人覺得龍書裡面第4章提供的Direct3D 初始化項目封裝得比較好,而且DirectX SDK Samples裡面的初始化程式過於精簡, ...
  • 怎樣才能開始一個互動式解釋器的會話? 在Windows下可以通過點擊開始按鈕,選擇“程式”,點擊“Python”,然後選擇“Python(command line)”菜單選項來開始一個交互會話。 你應該在哪裡輸入系統命令行來啟動一個腳本文件? 在輸入系統命令行的地方,也就是你所在的平臺提供給作為系統 ...
  • 猜猜看,下麵這一組調查對象是什麼? 為什麼會這樣呢? 因為我在佈置作業的時候,很貼心地給了一個樣例,是我之前寫的一篇教程《 如何用R和API免費獲取Web數據? 》。 於是,多組作業,都雷同。 講到這裡,他們一副不好意思的表情。 我卻發覺,這裡蘊藏著一個問題。 幾乎所有國內雲市場的 API 產品,都 ...
  • 備忘錄模式-Memento Pattern Memento備忘錄設計模式是一個保存另外一個對象內部狀態拷貝的對象,這樣以後就可以將該對象恢復到以前保存的狀態。 本文中的場景: 有一款游戲可以隨時存檔, 存檔完成後就可以讀取檔案里的數據, 然後下次開機就可以從那個時間點繼續玩游戲了. 有一個小孩通過存 ...
  • ACM 2003 求實數的絕對值 import java.util.Scanner; public class Lengxc { public static void main(String[] args) { Scanner scanner = new Scanner(System.in); wh ...
  • 如: Enum ShowPosition { 首頁 = 0,一級分類頁 = 1,二級分類頁 = 2 } 想獲得漢字對應的數字,可用GetHashCode() html展示如下:迴圈枚舉 @foreach (B2B.Enum.ShowPosition pd in Enum.GetValues(type ...
  • 點陣圖法是大數據處理中經常用到的技巧,覺得挺有趣,就來講幾句,希望能把點陣圖的思想解釋清楚。 個人理解,如有錯誤,歡迎各路大神指正! 點陣圖法:電腦中表示數據的最小單位為Bit,存儲0或者1。而c#中int的大小為4個位元組,即32個bit。 如果用int類型表示一個數值,那麼一個數值就需要用到32位的存 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...