Elasticsearch 入門實戰(6)--索引生命周期管理

来源:https://www.cnblogs.com/wuyongyin/archive/2022/07/30/16457045.html
-Advertisement-
Play Games

精華筆記: 1. 變數:存數的 - 聲明: 在銀行開了個帳戶 - 初始化: 給帳戶存錢 - 使用: 使用的是帳戶裡面的錢 - 對變數的使用就是對它所存的那個數的使用 - 變數在使用之前必須聲明並初始化 - 命名: - 只能包含字母、數字、_和$符,並且不能以數字開頭 - 嚴格區分大小寫 - 不能使用 ...


索引生命周期管理 (Index cycle management: ILM) 是在 Elasticsearch 6.7 版正式推出的一項功能,它是 Elasticsearch 的一部分,主要用來幫助管理索引。

1、簡介

如果你要處理時間序列數據,則不想將所有內容連續轉儲到單個索引中。 取而代之的是,你可以定期將數據滾動到新索引,以防止數據過大而又緩慢又昂貴。 隨著索引的老化和查詢頻率的降低,你可能會將其轉移到價格較低的硬體上,並減少分片和副本的數量。

要在索引的生命周期內自動移動索引,可以創建策略來定義隨著索引的老化對索引執行的操作,這樣可以確保所有索引具有相似的大小。

ILM 由一些策略(policies)組成,而這些策略可以觸發一些 actions。這些 actions 可以為:

 Action Description 
 rollover  創建一個新的索引,基於數據的時間跨度,大小及文檔的多少
 shrink  減少 primary shards 的數目
 force merge  合併 shard 的 segments
 freeze  針對鮮少使用的索引進行凍結以節省記憶體
delete 永久地刪除一個索引

索引生命周期由五個階段(phases)組成:hot,warm,cold,frozen 及 delete。每個階段有一組可用的 actions。這些 actions 由上面的 actions 中的一些組成。把這些階段和相應的 actions 一起組合起來就形成了一個策略(policy)。我們可以通過 API 的形式或者直接在 Kibana 中使用 UI 的形式來創建這些 policies。

ILM 策略實例:

在 hot 階段,你可能 rollover 一個 alias 從而每兩個星期就生成一個新的索引,避免太大的索引數據。在這個階段你可以做導入數據,並允許繁重的搜索。
在 warm 階段,你可能把索引變成 read-only,並把索引保留於這個階段一個星期。在這個階段,不可以導入數據,但是可以進行適度的搜索。
在 cold 階段,你可能 freeze 索引,並減少 replica 的數量,並保留於這個階段三個星期。在這個階段,不可以導入數據,但是可以進行極其少量的搜索,
在 delete 階段,只有一個動作可以選擇。比如你可以刪除超過 6 個星期的索引數據以節省成本。

索引在 Elasticsearch 中的生命周期:

 針對一個超大規模的集群:

 各節點職責:

2、生命周期管理演示

2.1、啟動 Elasticsearch 集群

啟動三個節點(10.49.196.10、10.49.196.11、10.49.196.12)的集群,其中兩個為 hot 節點(存放 hot 階段的數據),一個為 warm 節點(存放 warm 階段的數據)。

在 10.49.196.10、10.49.196.11 上運行:

bin/elasticsearch -d -E node.attr.data=hot

在 10.49.196.12 上運行:

bin/elasticsearch -d -E node.attr.data=warm

查看 node 屬性信息:

GET _cat/nodeattrs?v

2.2、創建 ILM policy

PUT _ilm/policy/my_policy
{
  "policy": {
    "phases": {
      "hot": {
        "actions": {
          "rollover": {
            "max_size": "10mb",
            "max_age": "1d",
            "max_docs": 5
          }
        }
      },
      "warm": {
        "min_age": "5m",
        "actions": {
          "shrink": {
            "number_of_shards": 1
          },
          "allocate": {
            "number_of_replicas": 0,
            "require": {
              "data": "warm"
            }
          }
        }
      },
      "delete": {
        "min_age": "10m",
        "actions": {
          "delete": {}
        }
      }
    }
  }
}

這裡定義的 policy 意思為:

熱階段

索引創建 1 天後、索引大小達到 10MB  或 索引文檔數達到 5(符合任何一個即可),該索引將滾動更新,系統將創建一個新索引。該新索引將重新啟動策略,而當前的索引(剛剛滾動更新的索引)將在滾動更新後等待 5 分鐘進入溫階段。

溫階段

索引進入溫階段後,ILM 會將索引收縮到 1 個分片 0 個副本,通過分配操作將索引移動到溫節點。完成該操作後,索引將再等待 5 分鐘 (時間都是從滾動跟新算起,10 - 5 = 5)後進入刪除階段。

刪除階段

刪除階段具有用於刪除索引的刪除操作。在刪除階段,您將始終需要有一個 min_age 條件,以允許索引在給定時段內待在熱、溫或冷階段。

2.3、創建 Index template

PUT _template/my_template
{
  "index_patterns": ["test-*"],
  "settings": {
    "index.lifecycle.name": "my_policy",
    "index.lifecycle.rollover_alias": "test-alias",
    "index.routing.allocation.require.data": "hot",
    "index": {
      "number_of_shards": 2,
      "number_of_replicas": 1
    }
  },
  "mappings": {
    "properties": {
      "age": {
        "type": "integer"
      },
      "name": {
        "type": "keyword"
      },
      "poems": {
        "type": "text",
        "analyzer": "ik_max_word",
        "search_analyzer": "ik_smart"
      },
      "about": {
        "type": "text",
        "analyzer": "ik_max_word",
        "search_analyzer": "ik_max_word"
      },
      "success": {
        "type": "text",
        "analyzer": "ik_max_word",
        "search_analyzer": "ik_max_word"
      }
    }
  }
}

所有以 test- 開頭的 index 都需要遵循這個規律。這裡定義了 rollover 的 alias 為 “test-alias”。需要註意的是 "index.routing.allocation.require.data": "hot",這定義了我們需要 indexing 的 node 的 data 屬性是 hot。

2.4、定義 Index alias

PUT test-000001
{
  "aliases": {
    "test-alias": {
      "is_write_index": true
    }
  }
}

這裡定義了一個叫做 test-alias 的 alias,它指向 test-00001 索引。註意這裡的 is_write_index 為 true。如果有 rollover 發生時,這個alias會自動指向最新 rollover 的 index。

使用 elasticsearch-head 查看該索引:

2.5、新增數據

POST test-alias/_bulk
{"index":{"_id":"1"}}
{"age": 30,"name": "李白1","poems": "靜夜思","about": "字太白","success": "創造了古代浪漫主義文學高峰、歌行體和七絕達到後人難及的高度"}
{"index":{"_id":"2"}}
{"age": 30,"name": "李白2","poems": "靜夜思","about": "字太白","success": "創造了古代浪漫主義文學高峰、歌行體和七絕達到後人難及的高度"}
{"index":{"_id":"3"}}
{"age": 30,"name": "李白3","poems": "靜夜思","about": "字太白","success": "創造了古代浪漫主義文學高峰、歌行體和七絕達到後人難及的高度"}
{"index":{"_id":"4"}}
{"age": 30,"name": "李白4","poems": "靜夜思","about": "字太白","success": "創造了古代浪漫主義文學高峰、歌行體和七絕達到後人難及的高度"}
{"index":{"_id":"5"}}
{"age": 30,"name": "李白5","poems": "靜夜思","about": "字太白","success": "創造了古代浪漫主義文學高峰、歌行體和七絕達到後人難及的高度"}
{"index":{"_id":"6"}}
{"age": 30,"name": "李白6","poems": "靜夜思","about": "字太白","success": "創造了古代浪漫主義文學高峰、歌行體和七絕達到後人難及的高度"}

2.5、rollover

已經有超過 5 個文檔了,將會 rollover;rollover 掃描間隔預設時 10 分鐘,可以通過修改 indices.lifecycle.poll_interval 參數來改變預設的間隔時間。

PUT _cluster/settings
{
    "transient": {
      "indices.lifecycle.poll_interval": "30s"
    }
}

rollover 後會生成新的索引:

2.6、進入 warm 階段

rollover 後,索引 test-000001 等待 5 分鐘左右後將會進入 warm 階段。

rollover 後的情況:

 rollover 後等待 5 分鐘左右後,索引 test-000001 已被重命名為 shrink-so7u-test-000001:

2.7、進入 delete 階段

在 warm 階段再等待 5 分鐘(10m - 5m)左右後, shrink-so7u-test-000001 進入 delete 階段,索引將被刪除。



參考:

1、https://elasticstack.blog.csdn.net/article/details/102728987

2、https://elasticstack.blog.csdn.net/article/details/102856967

 

 

 

 



 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 數組 數據結構 數據結構顧名思義 就數據的結構 (邏輯結構 存儲結構 演算法) 存儲結構 (數據存儲的結構方式) 線性結構 數組(順序表)隊列棧堆鏈表非線性結構樹圖 hash(散列表) 只要是能存數據的容器 就必須具備增刪改查的方法 數組(個人簡介就是一個地址吧很多東西都存起來) 數組概述:數組固定一 ...
  • 數組是一個存儲結構(可以進行增刪改查操作) 添加(add push append...) 棧方法(先進後出 後進先出)push入棧 pop出棧操作 push方法(添加到最後一個) var arr = [1] arr.push(10) console.log(arr) //[1,10] 隊列方法(先進 ...
  • 蒼穹之邊,浩瀚之摯,眰恦之美; 悟心悟性,善始善終,惟善惟道! —— 朝槿《朝槿兮年說》 寫在開頭 這些年,隨著CPU、記憶體、I/O 設備都在不斷迭代,不斷朝著更快的方向努力。在這個快速發展的過程中,有一個核心矛盾一直存在,就是這三者的速度差異。CPU 和記憶體的速度差異可以形象地描述為:CPU 是天 ...
  • 參考源 https://www.bilibili.com/video/BV1mc411h719?p=9&vd_source=299f4bc123b19e7d6f66fefd8f124a03 代理模式(Proxy Pattern)屬於結構型模式 概述 代理模式就是一個代理對象來間接訪問對象,常用於無法 ...
  • 參考源 https://www.bilibili.com/video/BV1mc411h719?p=8&vd_source=299f4bc123b19e7d6f66fefd8f124a03 橋接模式(Bridge Pattern)屬於結構型模式 概述 橋接模式是將抽象部分與它的實現部分分離,使它們都 ...
  • 為什麼要參加軟考: 軟考全稱是電腦技術與軟體專業技術資格考試,學生可以為畢業後面試錦上添花,已參加工作且不是本專業的拿個證在一定程度上彌補不是本專業的劣勢。如果你要往架構師、項目經理等晉升,有些企業面試會有證優先。另外評職稱、積分落戶等都一定用處。本人屬於已參加工作。 —————————————— ...
  • 1、引例 【例1】 分析該程式,有哪些問題 int main() { swap(int p, int q); int a = 10, b = 20; printf("(1)a = %d, b = %d\n", a, b); swap(&a, &b); printf("(2)a = %d, b = % ...
  • 精華筆記: 1. 運算符: - 算術:+、-、*、/、%、++、-- - 關係:>、<、>=、<=、==、!= - 邏輯:&&、||、! - 賦值:=、+=、-=、*=、/=、%= - 字元串連接:+ - 條件/三目:boolean?數1:數2 2. 分支結構:基於條件執行的語句 - if結構:1條 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...