ElasticStack學習(三):ElasticSearch基本概念

来源:https://www.cnblogs.com/supersnowyao/archive/2019/07/09/11131790.html
-Advertisement-
Play Games

1、文檔 1)ElasticSearch是面向文檔的,文檔是所有可搜索數據的最小單位。例如: a)日誌文件中的日誌項; b)一張唱片的詳細信息; c)一篇文章中的具體內容; 2)在ElasticSearch中,文檔會被序列化成Json格式: a)Json對象是由欄位組成的; b)每個欄位都有對應的字 ...


1、文檔

  1)ElasticSearch是面向文檔的,文檔是所有可搜索數據的最小單位。例如:

    a)日誌文件中的日誌項;

    b)一張唱片的詳細信息;

    c)一篇文章中的具體內容; 

  2)在ElasticSearch中,文檔會被序列化成Json格式:

    a)Json對象是由欄位組成的;

    b)每個欄位都有對應的欄位類型(如:字元串、數值、日期類型等);

  3)每個文檔都有一個唯一的ID(Unique ID)

    a)可以自己指定此ID;

    b)也可以通過ElasticSearch自動生成;

   4)我們可以將文檔理解成關係型資料庫中的一條數據記錄,一條記錄包含了一系列的欄位。

   5)Json文檔的格式不需要預先定義

    a)欄位的類型可以指定或者由ElasticSearch自動推算;

    b)Json支持數組、支持嵌套,如下圖所示:

    

  6)每一個文檔中都包含有一份元數據,元數據的作用主要是用來標註文檔的相關信息,如:

    a)_index:文檔所屬的索引名;

    b)_type:文檔所屬的類型名(從7.0開始,每一個索引只能創建一個Type:_doc,在此之前一個索引是可以設置多個Type的);

    c)_id:文檔的Unqie Id;

    d)_source:文檔的原始Json數據;

    e)_version:文檔的版本信息;

    f)_score:文檔的相關性算分;

 2、索引(Index)

  1)索引指的就是一類文檔的集合,相當於文檔的容器。

    a)索引體現了邏輯空間的概念,每個索引都有自己的Mapping定義,用來定義所包含的文檔的欄位名和欄位類型;

    b)索引中的數據(文檔)分散在Shard(分片)上,Shard體現了物理空間的概念;

  2)索引的Mapping與Setting:

    a)Mapping定義文檔欄位的類型;

    

    b)Setting定義不同的數據分佈;

    

   3)索引的含義:

    a)一般說“索引文檔到ElasticSearch的索引中”,前面的索引指的是一個動詞的含義,也就是保存一個文檔到ElasticSearch中。後面的索引是指在ElasticSearch集群中,可以創建很多個不同的索引;

    b)索引分為:B樹索引和倒排索引,而倒排索引在ElasticSearch中是非常重要的;

3、ElasticSearch與RDBMS的代入理解與類比如下: 

  

  兩者相對比,若對數據進行全文檢索,以及進行算分時,ElasticSearch更加合適;當涉及的數據事務比較高時,那RDBMS更加合適。在實際生產中,一般是兩者進行結合使用。

4、集群

ElasticSearch集群實際上是一個分散式系統,而分散式系統需要具備兩個特性:

  1)高可用性

    a)服務可用性:允許有節點停止服務;

    b)數據可用性:部分節點丟失,不會丟失數據;

  2)可擴展性

    隨著請求量的不斷提升,數據量的不斷增長,系統可以將數據分佈到其他節點,實現水平擴展;

ElasticSearch的集群通過不同的名字來進行區分,預設名字“elasticsearch”;

可以通過配置文件修改或者命令行修改:-E cluster.name=test

一個集群中可以有一個或者多個節點;

5、節點

  1)節點是什麼?

    a)節點是一個ElasticSearch的實例,其本質就是一個Java進程;

    b)一臺機器上可以運行多個ElasticSearch實例,但是建議在生產環境中一臺機器上只運行一個ElasticSearch實例;

  2)每個節點都有名字,可以通過配置文件進行配置,也可以通過命令行進行指定,如:-E node.name=node1

  3)每個節點在啟動之後,會被分配一個UID,保存在data目錄下;

  4)Master-Eligible【有資格、勝任者】 Node與Master Node的說明:

    a)每個節點啟動之後,預設就是一個Master Eligible節點,當然可以在配置文件中將其禁止,node.master:false

    b)Master-Eligible Node可以參加選主流程,成為Master Node;

    c)當第一個節點啟動時,它會將其選舉為Master Node;

    d)每個節點都保存了集群狀態,但只有Master Node才能修改集群的狀態,包括如下:

      所有的節點信息;

      所有的索引和其相關的Mapping與Setting信息;

      分片的路由信息;

   5)Data Node與Coordinating【協調、整合】 Node的說明:

    a)Data Node:可以保存數據的節點,負責保存分片數據,在數據擴展上起到至關重要的作用;

    b)Coordinating Node:它通過接受Rest Client的請求,會將請求分發到合適的節點,最終將結果彙集到一起,再返回給Client;

      每個節點都預設起到Coordinating Node的職責;

  6)Hot Node(熱節點)與Warm Node(冷節點)的說明:

    Hot Node:有更好配置的節點,其有更好的資源配置,如磁碟吞吐、CPU速度;

    Warm Node:資源配置較低的節點;

  7)Machine Learning Node:負責機器學習的節點,常用來做異常檢測;

  8)配置節點類型

  每個節點在啟動時,會讀取elasticsearch.yml配置文件,來確定當前節點扮演什麼角色。在生產環境中,應該將節點設置為單一的角色節點,這樣可以有更好的性能,更清晰的職責,可以針對節點的不同給予不能的機器配置。

  

6、分片

  1)Primary Shard(主分片)

    可以解決數據水平擴展的問題,通過主分片,可以將數據分佈到集群內的所有節點之上。

    a)一個主分片是一個運行的Lucene的實例;

    註意:一個節點對應一個ES實例;

      一個節點可以有多個index(索引);

      一個index可以有多個shard(分片);

      一個分片是一個lucene index(此處的index是lucene自己的概念,與ES的index不是一回事);

    b)主分片數是在索引創建時指定,後續不允許修改,除非Reindex;

  2)Replica Shard(副本)

    可以解決數據高可用的問題,它是主分片的拷貝。

    a)副本分片數可以動態調整;

    b)增加副本數,在一定程度上可以提高服務的可用性;

  3)分片的設定

  對於生產環境中分片的設定,需要提前做好容量規劃,因為主分片數是在索引創建時預先設定的,後續無法修改。

    a)分片數設置過小

      導致後續無法增加節點進行水平擴展。

      導致分片的數據量太大,數據在重新分配時耗時;

    b)分片數設置過大

      影響搜索結果的相關性打分,影響統計結果的準確性;

      單個節點上過多的分片,會導致資源浪費,同時也會影響性能;

 7、ElasticSearch健康狀況的查看

  

  1)Green:主分片與副本都正常分配;

  2)Yellow:主分片全部正常分配,有副本分片未能正常分配;

  3)Red:有主分片未能分配;

8、總結

  通過上面介紹,我們可以知道,索引與文檔更偏向於開發人員的視角,屬於邏輯上的一種概念;節點與分片更偏向於運維人員的視角,屬於物理上的一種概念。

 

  大家可關註我的公眾號

  

  知識學習來源:《Elasticsearch核心技術與實戰》


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. 基礎知識點圖解 編程語言核心結構:變數、基本語法、分支、迴圈、數組、…… Java面向對象的核心邏輯:OOP、封裝、繼承、多態、介面…… 開發Java SE高級應用程式:異常、集合、I/O、多線程、反射機制、網路編程…… 2. 各種語言對比 3. Java誕生 Sun公司(斯坦福大學網路,不是 ...
  • 寫作於:2019-07-09 關鍵字:1.MySQL、 2.MySQL Workbench、 3.eclipse、 4.JDBC連接測試 1.MySQL 一、資源下載 三步下載: 第一步:選擇安裝程式頁面(https://dev.mysql.com/downloads/installer/) 第二步 ...
  • 連接池技術 連接池技術的核心思想是:連接復用,通過建立一個資料庫連接池以及一套連接使用、分配、管理策略,使得該連接池中的連接可以得到高效、安全的復用,避免了資料庫連接頻繁建立、關閉的開銷。另外,由於對JDBC中的原始連接進行了封裝,從而方便了資料庫應用對於連接的使用(特別是對於事務處理),提高了獲取 ...
  • 表結構如下: –1.學生表 Student(s_id,s_name,s_birth,s_sex) –學生編號,學生姓名, 出生年月,學生性別 –2.課程表 Course(c_id,c_name,t_id) – –課程編號, 課程名稱, 教師編號 –3.教師表 Teacher(t_id,t_name) ...
  • -- 空表不導出,建立表空間 select 'alter table '||table_name||' allocate extent;' from user_tables where num_rows=0 -- 查詢鎖表 select b.username,b.sid,b.serial#,logo... ...
  • 一、資料庫的介紹 資料庫(Database)是存儲與管理數據的軟體系統,就像一個存入數據的物流倉庫。每個資料庫都有一個或多個不同的API介面用於創建,訪問,管理,搜索和複製所保存的數據。我們也可以將數據存儲在文件中,但是在文件中讀寫數據速度相對較慢,所以我們使用關係型資料庫管理系統(RDBMS)來存 ...
  • 參考:https://github.com/hidu/mysql-schema-sync 需求:測試環境表結構變動同步到開發環境,兩個實例各有數百個庫,不適合每個庫寫一個配置文件 環境:操作系統ubuntu16.04、兩個資料庫實例percona5.7、golang版本1.12 安裝mysql-sc ...
  • 表結構如下: id varchar(32) info json 數據: 現在我需要獲取info中disanme的值,查詢方法有: 1. 結果: id = 1, disname=“小明” 以上sql查出的disname值是帶有雙引號的,有時我們不需要雙引號,此時就需要用到下麵這種方式。 2. 結果: ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...