MongoDB排序時記憶體大小限制和創建索引的註意事項!

来源:https://www.cnblogs.com/codeflyer/archive/2022/05/06/16227595.html
-Advertisement-
Play Games

線上服務的MongoDB中有一個很大的表,我查詢時使用了sort()根據某個欄位進行排序,結果報了下麵這個錯誤: [Error] Executor error during find command :: caused by :: Sort operation used more than the ...


線上服務的MongoDB中有一個很大的表,我查詢時使用了sort()根據某個欄位進行排序,結果報了下麵這個錯誤:

[Error] Executor error during find command :: caused by :: Sort operation used more than the maximum 33554432 bytes of RAM. Add an index, or specify a smaller limit.
at line 0, column 0

這是個非常常見的MongoDB報錯了。因為MongoDB處理排序時,如果排序的欄位沒有建立索引,會把全表都丟到記憶體中處理。

If MongoDB cannot use an index or indexes to obtain the sort order, MongoDB must perform a blocking sort operation on the data. A blocking sort indicates that MongoDB must consume and process all input documents to the sort before returning results.

而記憶體的大小並不是無限使用的,MongoDB的預設設置是32MB。一旦數據量超過32MB,則會報錯。

參數internalQueryExecMaxBlockingSortBytes

32MB這個限制是在參數internalQueryExecMaxBlockingSortBytes中控制。你可以在MongoDB的客戶端上直接查看這個參數的值,執行以下語句:

db.runCommand({
    getParameter: 1,
    "internalQueryExecMaxBlockingSortBytes": 1
})

返回如下結果:

// 1
{
    "internalQueryExecMaxBlockingSortBytes": NumberInt("33554432"),
    "ok": 1,
    "operationTime": Timestamp(1651142670, 1),
    "$clusterTime": {
        "clusterTime": Timestamp(1651142670, 1),
        "signature": {
            "hash": BinData(0, "X09M2FBji5f+FOwaK/nLTv4+Ybs="),
            "keyId": NumberLong("7080087363631710209")
        }
    }
}

所以解決排序時記憶體使用超過32MB的問題,有兩個方法:

  1. 給排序的欄位加索引。具體怎麼加索引,會在後面細講。
  2. 修改internalQueryExecMaxBlockingSortBytes參數的大小,使用命令如下:
db.adminCommand({
    setParameter: 1,
    internalQueryExecMaxBlockingSortBytes: 104857600
}) 

MongoDB 4.3的internalQueryMaxBlockingSortMemoryUsageBytes

我準備在本地的MongoDB上復現這個問題,於是把這個表直接導入到本地MongoDB中。結果發現排序時並沒有報錯。使用上面的命令查看internalQueryExecMaxBlockingSortBytes參數的值時,返回如下結果:

[17][ProtocolError] no option found to get

Google了一下,發現了MongoDB的官方網站上的兩個相關JIRA。

第一個JIRA [SERVER-44053] Rename setParameter for maximum memory usage of blocking sort - MongoDB Jira里表示,在4.3.1版本時,因為參數命名描述不清楚,所以將參數internalQueryExecMaxBlockingSortBytes改為了internalQueryMaxBlockingSortMemoryUsageBytes。這解釋了為什麼我執行查詢參數的語句時,沒有返回結果。

第二個JIRA [SERVER-50767] internalQueryExecMaxBlockingSortBytes causing config exception on mongod load - Mongo中,Comments里提到了,新的internalQueryMaxBlockingSortMemoryUsageBytes參數,預設值從32MB改成了100MB。也許我的這個表使用100MB記憶體進行排序就夠用了,所以沒有報錯。

img

所以在4.3以上的版本(本機是5.0.4),執行以下命令:

db.runCommand({
    getParameter: 1,
    "internalQueryMaxBlockingSortMemoryUsageBytes": 1
})

可以看到查詢結果:

{
    "internalQueryMaxBlockingSortMemoryUsageBytes": NumberInt("104857600"),
    "ok": 1
}

而伺服器上的MongoDB版本為4.0.3,因此是爆出來最上面的問題。

排序欄位如何加索引?

這是個很簡單的問題,你用哪個欄位排序,就對哪個欄位加索引就好了。比如我要根據A欄位進行排序,則增加A欄位的索引。

-- 加索引
db.bigMongoTable.createIndex({
    "A": 1
});
-- 查詢
db.bigMongoTable.find({}).sort({
    "A": 1
});

但是如果我改主意了,我要根據A、B兩個欄位做排序:

db.bigMongoTable.find({}).sort({
    "A": 1,
    "B": 1
});

那麼熟悉的報錯就又回來了。

是的!機智的MongoDB並不會像我們想的那樣,先用上A的索引,從而省點力氣。他依舊會把全部的數據丟到記憶體里排序……

那我再加個B欄位的索引吧,畢竟在MongoDB查詢的時候,對兩個欄位分別建單鍵索引,靈活性比直接建一個複合索引要好一些,而且MongoDB的索引交集也可以讓這兩個單鍵索引實現和複合索引一樣的效果。

哦,不行喲,還是那個報錯。

所以,當多欄位排序時,你必須要建一個包含了這些欄位的複合索引,且要註意以下幾點:

  1. 查詢時參與排序的多個欄位的順序,要和創建的索引每個欄位的順序保持一致。比如你創建的索引是:db.bigMongoTable.createIndex({"A":1,"B":1,"C":1});那麼你的排序語句也要按照順序如下:sort({"A":1,"B":1,"C":1})。如果你調換A和B的順序,如下:sort({"B":1,"A":1,"C":1}),則索引不會生效。
  2. 參與查詢的欄位少於索引的欄位,則要保證符合首碼匹配。還是第一點里的索引,如果排序語句是這樣:sort({"A":1,"B":1}),則索引繼續生效。如果是這樣:sort({"A":1,"C":1}),則無法生效。這個你可以理解成和MySQL類似,索引都是按照最左匹配規則去觸發的,一條索引的中間部分跳過了就無效了。
  3. 參與sort的欄位的排序方式,要和創建索引時的排序方式保持完全一致,或者完全相反。對於第一點里的索引,如果查詢sort({"A":-1,"B":1})或者sort({"A":1,"B":-1}),索引則不會生效。只有在查詢sort({"A":1,"B":1})或者sort({"A":-1,"B":-1})時,索引才會生效。

總結

  1. MongoDB的查詢結果在進行排序時,如果排序欄位沒有添加索引,會將數據全部放到記憶體中計算。如果數據量過大,超過配置的記憶體大小,則會報錯。
  2. 4.3版本之前,使用記憶體的最大值通過參數internalQueryExecMaxBlockingSortBytes控制,預設為32MB。4.3版本之後,通過參數internalQueryMaxBlockingSortMemoryUsageBytes控制。
  3. 正常的解決方式是添加索引,但是索引要包括全部參與排序的欄位,且要遵循首碼匹配策略。

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Linux 系統中,最常用的歸檔(打包)命令就是 tar,該命令可以將許多文件一起保存到一個單獨的磁帶或磁碟中進行歸檔。不僅如此,該命令還可以從歸檔文件中還原所需文件,也就是打包的反過程,稱為解打包。 使用 tar 命令歸檔的包通常稱為 tar 包(tar 包文件都是以“.tar”結尾的)。 tar ...
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 Ubuntu 暫時不能解析功能變數名稱及解決辦法 可能的解決方案:重啟虛擬機網卡 前提:主機使用無線網,Win10;虛擬機採用NAT模式,Ubuntu20.04 最近移動過vmware的文件,導致虛擬機開機後使用sudo apt-get時會提示暫時不能解 ...
  • 在Linux環境下,使用Shell腳本自動備份資料庫,需要用到 crontab 定時任務,以下是使用 mysqldump 方式對資料庫備份 1、新建shell腳本,這裡命名為 dbbackup.sh /usr/bin/mysqldump -u用戶名 -p密碼 -h 資料庫IP -R --opt 要備 ...
  • 5、1 設定像素 設定像素一般用四個位元組,最高位省略不用。 // 5-1-PWCP_設定像素_顏色.cpp : 定義應用程式的入口點。 // #include "framework.h" #include "5-1-PWCP_設定像素_顏色.h" #define MAX_LOADSTRING 100 ...
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 1 您需要瞭解 安裝源您可訪問 CentOS官網 / 阿裡雲鏡像站 等 進行下載 CentOS 7 系列其他版本安裝方法一致 為更好顯示文章層次結構,便於觀看,您可點擊左上角目錄按鈕進行瀏覽 2 安裝過程 2.1 啟動項 Install Cent ...
  • 本文例子參考《STM32單片機開發實例——基於Proteus虛擬模擬與HAL/LL庫》 源代碼:https://github.com/LanLinnet/STM33F103R6 項目要求 實現矩陣鍵盤掃描,當按下任意一個按鈕時,數位管立即顯示當前按下按鈕對應鍵值。 硬體設計 在第一節的基礎上,在Pr ...
  • 文章作者:阿裡零售通演算法團隊 出品社區:DataFun 導讀: 零售通作為阿裡巴巴新零售的八路大軍之一,肩負著“共建智能分銷平臺”和“讓百萬小店擁抱DT時代”的重要使命。一方面,我們通過線上平臺(零售通APP)將零售品牌商的貨品展現給小店的店主,並提供交易渠道讓店主進行批發進貨;另一方面,我們通過天 ...
  • 環境準備 客戶端 Windows 10 ArcCatalog 10.8.1 精簡版Oracle Client 12 - 32 bit 安裝包名稱:instantclient-basic-nt-12.1.0.2.0.zip Navicat Premium 15 服務端 Windows Server 2 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...