01 elasticsearch 概念理解

来源:https://www.cnblogs.com/gonson/archive/2018/07/18/9328941.html
-Advertisement-
Play Games

ElasticSearch 學習筆記 Near Realtime(NRT):近實時,先說實時就是數據創建到查詢時間在毫秒級或更少; 和實時不一樣的是近實時數據在創建到查詢最多需要n秒時間,n秒是索引刷新周期(假如設置n為5秒,若你在2秒的時候插入了一條數據,那麼你還需要等3秒才能查詢到這條數據,... ...


最近在看一套 es 的教學視頻,以下筆記主要來自視頻資源

Near Realtime(NRT):近實時,先說實時就是數據創建到查詢時間在毫秒級或更少; 和實時不一樣的是近實時數據在創建到查詢最多需要n秒時間,n秒是索引刷新周期(假如設置n為5秒,若你在2秒的時候插入了一條數據,那麼你還需要等3秒才能查詢到這條數據, 若你在4秒時插入那麼你需要再等1秒即可)。 Ps:因為還沒學習到es 的配置不知道n 最小可以設置成多少?值得考慮的是n設置成多少才會對相應的系統更高效?

Cluster:集群, es 是一個分散式的搜索引擎,顧名思義es 可以實現分散式架構包含多個節點,每個節點屬於哪個集群是通過一個配置(集群名稱,預設是elasticsearch)來決定的

Node: 節點, 集群中的一個節點,節點也有一個名稱(預設是隨機分配的),節點名稱很重要(在執行運維管理操作的時候),預設節點會去加入一個名稱為“elasticsearch”的集群

Document:文檔, es中的最小數據單元,一個document可以是一條客戶數據,一條商品分類數據,一條訂單數據,通常用JSON數據結構表示, 例如:一個學生的 document 如下

{
"id": "2018001",
"name": "張三",
"age":"17""class": "三年一班",
"sex": "male"
}

 

Field:域值,Document由一系列的Fields組成,每一個Field都有一個名字和值,每個field就是一個數據欄位。例如上面document 中 "name":"張三" 就是一個field

Index:索引,包含一堆有相似結構的文檔數據,比如可以有一個客戶索引,商品分類索引,訂單索引,索引有一個名稱。一個index包含很多document,一個index就代表了一類類似的或者相同的document。比如說建立一個product index,商品索引,裡面可能就存放了所有的商品數據,所有的商品document。

Type:類型,每個索引里都可以有一個或多個type,type是index中的一個邏輯數據分類,一個type下的document,都有相同的field,但是一個索引下可以有分很多種類,每個種類的document的field可能不太一樣

Index ->家用電器
  type --> 電視
    document ---> {"產品序號" : "t001", "價格" : "2600.00", "品牌" : "HXXX", "尺寸" : "50英寸" }
    document ---> {"產品序號" : "t002", "價格" : "2300.00", "品牌" : "KXXX", "尺寸" : "49英寸" }
  type --> 空調
    document---> {"產品序號" : "a011", "價格" : "2799.00", "品牌" : "GXXX", "空調匹數" : "1.5P", "製冷量" : "3500W" }
    document---> {"產品序號" : "a021", "價格" : "2600.00", "品牌" : "MXXX","空調匹數" : "2P","製冷量" : "5250W" }

 

shard:主片段(shard 實際是指 primary shard), 單台機器無法存儲大量數據,es可以將一個索引中的數據切分為多個shard,分佈在多台伺服器上存儲。有了shard就可以橫向擴展,存儲更多數據,讓搜索和分析等操作分佈到多台伺服器上去執行,提升吞吐量和性能。每個shard都是一個lucene index。

replica: 副本片段, 任何一個伺服器隨時可能故障或宕機,此時shard可能就會丟失,因此可以為每個shard創建多個replica副本。replica可以在shard故障時提供備用服務,保證數據不丟失,多個replica還可以提升搜索操作的吞吐量和性能。primary shard(建立索引時一次設置,不能修改,預設5個),replica shard(隨時修改數量,預設1個),預設每個索引10個shard,5個primary shard,5個replica shard,最小的高可用配置,是2台伺服器。

-----------------------------------------

elasticsearch核心概念 vs. 資料庫核心概念

Elasticsearch ---> 資料庫
Document ----> 行
Type ----> 表
Index ----> 庫

 

學習筆記 - 若轉載請於明顯處標明出處:https://www.cnblogs.com/gonson/p/9328941.html 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 相信不少初學手機聯網開發的朋友都想知道Http與Socket連接究竟有什麼區別,希望通過自己的淺顯理解能對初學者有所幫助。 一、基本概念 1、TCP連接 手機能夠使用聯網功能是因為手機底層實現了TCP/IP協議,可以使手機終端通過無線網路建立TCP連接。TCP協議可以對上層網路提供介面,使上層網路數 ...
  • 複製當前文件夾下所有的文件名稱 複製的文件類型一: DIR *.* /B> XXX.txt 複製的文件類型二: DIR *.* /B> XXX.xls ...
  • win7自帶的截圖工具很好,很強大,比從網上下載的截圖工具好用多了,很少會出現問題。但是它能不能像QQ截圖工具一樣可以使用快捷鍵呢?今天小編和大家分享下心得,希望能夠給你的工作帶來快捷。 工具/原料 win7自帶截圖工具 工具/原料 win7自帶截圖工具 win7自帶截圖工具 win7自帶截圖工具 ...
  • 1.準備工具 1).交叉編譯工具 2).下載libcurl和openssl源代碼,我使用的是(openssl 1.0.2o.tar,curl 7.59.0.tar) 3).查看cpu詳細 2.開始編譯 openssl 庫版本 : openssl 1.0.2o march和 D__ARM_MAX_AR ...
  • 功能:用websocket技術,在運維工具的瀏覽器上實時顯示遠程伺服器上的日誌信息 一般我們在運維工具部署環境的時候,需要實時展現部署過程中的信息,或者在瀏覽器中實時顯示程式日誌給開發人員看。你還在用ajax每隔段時間去獲取伺服器日誌?out了,試試用websocket方式吧 我用bottle框架, ...
  • 一、安裝環境及配置yum 二、安裝MongoDB 三、驗證安裝結果 ...
  • 線程介紹 Intro 20世紀60年代人們提出了進程的概念,到20世紀80年代中期人們提出了比進程更小的能獨立運行的基本單位——線程,試圖用它來提高系統內程式併發執行的程度從而進一步提高系統的吞吐量。 線程具有傳統進程所具有的特征,所以稱之為輕型進程或進程元,相應的把傳統進程稱之為重型進程。 一個進 ...
  • 進程是操作系統為了提高系統的併發處理能力,為瞭解決可以“同時”運行多個程式且為了對併發執行的程式加以描述和控制而提出來的。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...