記一次Elasticsearch OOM的優化過程——基於segments force merge 和 store type 轉為 niofs

-Advertisement-

Elasticsearch OOM 優化改文件類型及segments force merge ...

首先，說明筆者的機器環境（不結合環境談解決方案都是耍流氓）: cpu 32核，記憶體128G，非固態硬碟： RAID0 (4T * 6)，單節點，數據量在700G到1800G，索引15億~21億。敖丙大人，在蘑菇街，可多集群分片，固態硬碟，比不起啊。

轉載請註明出處：https://www.cnblogs.com/NaughtyCat/p/elasticsearch-OOM-optimize-story.html

業務場景:

保存7天索引，每天有400G。發現ES時不時的OOM，和重啟。當索引超過500G的時候，ES重啟到載入所有分片，時間約30分鐘到1小時。

題外話，ES OOM 會生成 .hprof 文件，如下圖（作者【CoderBaby】）：

用jhat來分析OOM堆轉儲文件，具體命令如: jhat -port 7401 -J-Xmx4G java_pid19546.hprof

解決辦法：

改文件存儲類型，減少記憶體占用

設置存儲類型為：“hybridfs” ,即： "index.store.type": "hybridfs" （原來為“mmapfs”，詳見附2）。mmapfs — index映射到記憶體，niofs — 併發多線程以NIO的方式讀取index文件， hybridfs—混合 mmafs和niofs ,根據讀取模式選擇最佳的文件系統

效果：在600G左右的索引，5天索引，確實沒有了OOM。但一旦增大到7個索引，就不行了。用jstat命令，即：stat -gcutil 6811 （ES的PID）查看ES的jvm，如下圖：

O: Old space utilization as a percentage of the space's current capacity (老年代空間占用率）。O最高達到79，就往下降，原來為存儲類型為“mmapfs”，O很容易就飆到100.

關閉暫時不用的索引，減少打開索引的數量

關閉索引（文件仍然存在於磁碟，只是釋放掉記憶體，需要的時候可重新打開）。設置打開索引參數： "__es.maxPermanentlyOpenIndices":4 （最大打開索引：7改為4）。

擴大堆記憶體

設置堆大小，從15G提高到30G，即： -Xms30g -Xmx30g （註意：最大不要超過物理記憶體的 %50）

擴大虛擬記憶體空間

命令： sysctl -w vm.max_map_count=2621440（預設值是 “262144”），擴大這個，可以防止這個數量太低而導致的OOM（詳見附6）

forcemerge

設置merge時最大的線程數：index.merge.scheduler.max_thread_count。固態硬碟——預設最大值 Math.max(1, Math.min(4, Runtime.getRuntime().availableProcessors() / 2)) ，普通旋轉磁碟——設置為1

筆者機器上，單merge 線程，300G的索引耗時：7個小時

優化效果： term 單條件查詢，查詢時間從10秒多提高到3秒多，索引減少約%2.85，減少4000多萬，具體如下表：

index	total_segments_berfore_merge	total_segments_after_merge	query_IP_after(seconds)	query_IP_after(seconds)	decrease(count/percentage)
pcap_flow-2019-12-09	1412695374	137249867	10	3.6	40196703/ %2.845

可通過命令查看各個分片的情況，如下（可查看總的segments數量）：

curl -s "http://localhost:9200/_cat/segments/pcap_flow-2019-12-10?v&h=shard,segment,size,size.memory" | awk '{sum += $NF} END {print sum}'

force merge的restful API:

curl -X POST "localhost:9200/pcap_flow-2019-12-11/_forcemerge?max_num_segments=2"

說明：

1）max_num_segments，設置最大segement數量，數量越小，查詢速度提高越明顯，但merge耗時越長

2）全部merge，不加索引ID，則如下：

curl -X POST "localhost:9200/_forcemerge"

3）merge過程是串列的，如果同時merge多個，後面的會被阻塞，直到第一個merge完成為止。另外，對於不再有寫入的更新的index，才建議force merge，不然反而會讓搜索的性能更差

4）restful api 查看_segments，如下：

curl -X GET "localhost:9200/_cat/segments?v&pretty"

效果如下圖：

題外話，如果貴司銀子多，可以集群分片，搞SSD，否則只有結構優化，這一招。

附：

1）官網 index force merge說明： https://www.elastic.co/guide/en/elasticsearch/reference/7.4/indices-forcemerge.html

2） ES 存儲類型： https://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules-store.html

3）merge 線程數： https://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules-merge.html

4）磁碟陣列RAID： https://zh.wikipedia.org/wiki/RAID

5）關於索引合併的統計分析： http://openskill.cn/article/375

6）擴大虛擬地址空間： https://www.elastic.co/guide/en/elasticsearch/reference/current/vm-max-map-count.htm

*****************************************************************************************************

精力有限，想法太多，專註做好一件事就行

我只是一個程式猿。5年內把代碼寫好，技術博客字字推敲，堅持零拷貝和原創
寫博客的意義在於打磨文筆，訓練邏輯條理性，加深對知識的系統性理解；如果恰好又對別人有點幫助，那真是一件令人開心的事

*****************************************************************************************************

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

centos7下MySQL5.7修改默存儲路徑

安裝MySQL中YUM預設安裝路徑是/var/lib/mysql下，有時候該目錄分配的磁碟空間並不大，需要遷移到新的磁碟目錄 df -h 查看磁碟空間大小本次遷移到 /home目錄下 1.在home目錄下創建data目錄作為預設路徑 cd /home mkdir data 2.關掉MySQL se ...
帶你從頭到尾捋一遍MySQL索引結構（2）

前言 Hello我又來了，快年底了，作為一個有抱負的碼農，我想給自己攢一個年終總結。索性這次把資料庫中最核心的也是最難搞懂的內容，也就是索引，分享給大家。這篇博客我會談談對於索引結構我自己的看法，以及分享如何從零開始一層一層向上最終理解索引結構，書接上文。多頁模式在多頁模式下，MySQL終於可 ...
分散式學習day02

今天學習分散式的項目搭建,第二天使用 intelliJ IDEA 漸漸適應了操作搭建分散式項目,我把他分為一個父工程和14個子工程如圖是各項目的關係依賴: idea包結構: 搭建好我們所需要的工程之後,我們就需要配置XML文件和POM.xml文件父工程的POM文件 <!-- 集中定義依賴版本號 ...
Mysql基礎01-語法

資料庫數據的存儲：將數據放到表中，表再放到庫中。一個資料庫中可以有多個表，每個表都有一個名字，用來標識自己。表名具有唯一性。表由列組成，我們也稱為欄位。每個欄位描述了它所含有的數據的意義表由列組成，我們也稱為欄位。每個欄位描述了它所含有的數據的意義表中的數據是按行存儲的，一行即為一條記錄。 ...
會導致索引失效語句

1、使用like關鍵字模糊查詢時，% 放在前面索引不起作用，只有“%”不在第一個位置，索引才會生效（like ‘%文’–索引不起作用）2、使用聯合索引時，只有查詢條件中使用了這些欄位中的第一個欄位，索引才會生效3、使用OR關鍵字的查詢，查詢語句的查詢條件中只有OR關鍵字，且OR前後的兩個條件中的列都 ...
mysql分表之水平分割

一、背景老大安排要對某張大容量表進行分割，根據年份分割成多張表。二、水平分割水平拆分是指數據表行的拆分，表的行數超過百萬行時，就會變慢，這時可以把一張的表的數據拆成多張表來存放。定義規則分表後，表結構與原表相同，查詢性能會提高。 ····· 三、步驟。做好備份根據年份創建分區表(t_us ...
Redis—數據備份與恢復

https://www.cnblogs.com/shizhengwen/p/9283973.html https://blog.csdn.net/w2393040183/article/details/76167856 https://www.redis.net.cn/tutorial/3519.h ...
[20191213]toad 12下BIND_AWARE提示無效.txt

[20191213]toad 12下BIND_AWARE提示無效.txt--//鏈接http://blog.itpub.net/267265/viewspace-2130781/的測試,發現當時測試的錯誤.有空再次驗證看看.1.環境:SCOTT@book> @ ver1PORT_STRING VER ...