關於 NodeJs 處理超長字元串問題的分析

来源:https://www.cnblogs.com/yiyi17/archive/2023/02/09/17107397.html
-Advertisement-
Play Games

問題:對於超大的 string V8不能支持 問題背景 在 Nodejs 計算服務中,對端上上報的記憶體信息二進位數據進行預處理+緩存時,遇到了一個奇怪的報錯:RangeError: Invalid string length 。根據該報錯信息,查找得知是字元串長度超過了 node.js 的限制,即 ...


問題:對於超大的 string V8不能支持

問題背景

在 Nodejs 計算服務中,對端上上報的記憶體信息二進位數據進行預處理+緩存時,遇到了一個奇怪的報錯:RangeError: Invalid string length 。根據該報錯信息,查找得知是字元串長度超過了 node.js 的限制,即 2^29-1 (約 5 億+)個字元。整體流程如圖所示。
關於 node.js string 的長度上限,主要和 V8 引擎「壓縮指針」技術有關。按個人理解,其通過壓縮指向變數的地址(64 位)中固定的 32 位的方式,從而減少引擎的記憶體占用。

 

 

 

代碼細節

由於需要快速訪問某地址,因此緩存的數據結構必須是個對象,即 INodeGraph。具體結構如下:

  type IAddr = string; // 記憶體圖譜   declare interface INodeGraph {     [addr: IAddr]: IParsedNode;   } // 記憶體節點信息   declare interface IParsedNode {     addr: IAddr;     // size, nodeType 等輔助信息     parentNodeAddr: IAddr[]; // addr     childNodeAddr: string[]; // addr     edgeMap: {       [addr: IAddr]: {         // 當前節點與父子節點之間的邊(關係)的信息       };     };   }


我們目的很明確,就是實現這樣一個 js 大對象的持久化存儲,並且能夠方便快速的轉回 js object。為解決此問題,首先想到的能否利用 protobuf 替代 JSON 實現持久化。可惜的是 protobuf 並不適用於動態 key 的場景,它適用於處理數組中存儲多個相似結構對象的數據結構。


隨後嘗試了減少對象中不必要的信息,即縮短對象的固定 key,例如用「pNode」取代冗長的「parentNodeAddr」。對於一個百萬個鍵值對的 object 而言,雖然犧牲了代碼的可讀性,但在實際的 case 中,能承載的鍵值對數量大約多了 20%。
事實上回過頭來看,更好的處理方式或許是用另外的 Map 存儲對象的 key。例如 : 將 nodeGraph.parentNodeAddr 這個 key 最大程度縮短為 nodeGraph.p
聲明 const GraphKey = { parentNodeAddr: 'p' } 保存一個 key 的映射,需要訪問某屬性時,使用nodeGraph[GraphKey.parentNodeAddr]

更進一步

上述手段只是治標不治本,對於 key 更多的大對象並不能徹底解決問題。因此在不改變項目整體架構的前提下(如使用圖資料庫/改用 go 開發等),提出以下兩個最終方案:
方案 1:藉助 Node.js C++ Addons 的能力,繞開 js string 的限制,將相關序列化邏輯交給 C++ 處理,並直接將處理好的引用樹 js object 進行後續處理。

  • 優勢:如果能實現,性能會獲得優先提升;擴展了 Node.js 的能力
  • 劣勢:實現難度大;維護可能是個問題


方案 2:生成引用樹緩存時,拆分為多個較小的對象,分別進行序列化和存儲,使用時再合併為一個大對象。

  1. 優勢:無需 C++ 側開發,難度更小;維護方便
  2. 劣勢:合併對象需要額外的時間,這一步驟可能會讓未命中緩存時的首次請求更慢

 

 

你要覺得這篇文章比較好,記得點推薦!
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 設計原則系列文章 必知必會的設計原則——單一職責原則 必知必會的設計原則——開放封閉原則 必知必會的設計原則——依賴倒置原則 必知必會的設計原則——里氏替換原則 概述 1、 客戶端不應該依賴它不需要的介面。2、 一個類對另一個類的依賴應該建立在最小介面上。3、介面應儘量細分,不要在一個介面中放很多方 ...
  • 「CSDN」作為中國最具人氣的專業 IT 社區,一直是廣大 IT 技術博主的主選陣地。這些年 CSDN 在知識付費領域的探索也遠遠超過其它平臺,大家(尤其是創作型博主)對 CSDN 的認可度也越來越高,CSDN 上目前有很多非常優秀的技術專欄。 CSDN博客專家 是 CSDN 給予影響力較大的技術類 ...
  • 前言 AppImage 逐漸成為 Linux 常用的一種軟體包格式,本文將介紹如何將 AppImage 文件添加到 Ubuntu 的應用程式中。 如下圖中的 CAJViewer : 操作過程 設置相關許可權 對要操作的 AppImage 右擊 > 屬性進行如下圖的設置,必須勾選 允許執行文件 創建 d ...
  • JLink RTT(Real Time Transfer) 是用於嵌入式系統監控和交互的工具, 類似於SWO, 可以雙向通信, 特點是性能很高, 基本上不影響嵌入式應用的實時行為, 可以對比一下使用printf輸出日誌時的各種限制. 而且因為和 JLink 介面集成, 不需要再浪費一個串口輸出 pr... ...
  • PY32F002A, PY32F003, PY32F030 三個系列硬體相同, 下麵以 PY32F030的時鐘樹結構為例說明 內部時鐘有32KHz和24MHz(從代碼上看其實是8MHz),外部時鐘是直接接入, PLL只有2倍. 使用外置晶振時如果要達到標稱的48MHz, 晶振頻率就必須用24MHz,... ...
  • 為什麼會選擇Pop!_os 剛決定使用Linux系統的時候想的肯定是用Arch Linux(不得不說ArchWiki太NB了),但是遇到兩個麻煩沒有解決:1.連上wifi後發現沒有分配IPv4地址,google了一圈都沒找到解決方法。於是放棄了。2.第二次嘗試安裝Arch(主要是第一次安裝失敗後,心 ...
  • 使用JS的DOM(文檔對象模型)獲取前端迴圈的參數 使用Go語言渲染html,但是想讓網頁動起來,顯示一些彈窗還是比較麻煩的,於是乎,想到使用js獲取頁面的數據進行顯示,但是js無法載入go的一些變數。想了很久,突然在網頁調試的時候使用了js的DOM進行元素查找獲得了些許靈感最後實現了這個功能。 1 ...
  • 其他章節請看: react 高效高質量搭建後臺系統 系列 表格 有一種頁面在後臺系統中比較常見:頁面分上下兩部分,上部分是 input、select、時間等查詢項,下部分是查詢項對應的表格數據。包含增刪改查,例如點擊新建進行新增操作。就像這樣: 本篇將對 ant 的表格進行封裝。效果如下: spug ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...