一次Python本地cache不當使用導致的記憶體泄露

来源:https://www.cnblogs.com/AcAc-t/archive/2023/08/29/python_local_cache_usage.html
-Advertisement-
Play Games

數據類型是編程中的重要概念。數據類型指定了變數值的大小和類型。 Go是靜態類型的,這意味著一旦變數類型被定義,它只能存儲該類型的數據。 Go有三種基本數據類型: - bool:表示布爾值,要麼是true,要麼是false。 - 數值型:表示整數類型、浮點數值和複數類型。 - string:表示字元串 ...


背景

近期一個大版本上線後,Python編寫的api主服務使用記憶體有較明顯上升,服務重啟後數小時就會觸發機器的90%記憶體占用告警,分析後發現了本地cache不當使用導致的一個記憶體泄露問題,這裡記錄一下分析過程。

問題分析

LocalCache實現分析

該cache大概實現代碼如下:

class LocalCache():
    notFound = object() # 定義cache未命中時返回的唯一對象
    # list dict等本身不支持弱引用,但其子類支持,這裡包裝下
    class Dict(dict):
        def __del__(self):
            pass

    def __init__(self, maxlen=10): # maxlen指定最多緩存的對象個數
        self.weak = weakref.WeakValueDictionary() # 存儲緩存對象弱引用的dict
        self.strong = collections.deque(maxlen=maxlen) # 存儲緩存對象強引用的deque

    # 從緩存dict中查找對應key的對象,若已過期或不存在則返回notFound
    def get_ex(self, key):
        value = self.weak.get(key, self.notFound)
        if value is not self.notFound:
            expire = value['expire']
            if self.nowTime() > expire:
                return self.notFound
            else:
                return value['result']
        return self.notFound

    # 設置kv到緩存dict中,並設置其過期時間
    def set_ex(self, key, value, expire):
        self.weak[key] = strongRef = LocalCache.Dict({'result': value, 'expire': self.nowTime()+expire})
        self.strong.append(strongRef)

如上述代碼,該LocalCache核心在於一個存儲弱引用的weakref.WeakValueDictionary對象與存儲強引用的deque對象(Python中弱引用與強引用介紹可以參見這篇文章--Python中的弱引用與基礎類型支持情況探究 ),LocalCache實例化時可以指定最大緩存的對象個數。使用set_ex方法可以設置新的緩存kv,get_ex則獲取指定key的緩存對象,如果key不存在或者已過期則返回notFound。
該LocalCache通過deque在達到maxlen時按先進先出的順序移除隊列元素,而一旦對象的所有強引用被移除後,WeakValueDictionary的特性則保證了對應對象的弱引用也會直接從dict中被移除出去,如此即實現了一個簡單的支持過期時間和最大緩存對象數量限制的本地cache。

LocalCache使用占用記憶體的錯誤評估

按照上面的LocalCache原則,理論上只要設置合理的過期時間與maxlen值應該可以保證其合理記憶體的合理使用,而這次新版本發佈新增了類似如下兩個個LocalCache:

id_local_cache0 = LocalCache(500000)
id_local_cache1 = LocalCache(500000)
id_local_cache0.set_ex('user_id_012345678901', 'display_id_ABCDEFGH', 1800)
id_local_cache1.set_ex('display_id_ABCDEFGH', 'user_id_012345678901', 1800)

如上定義了兩個50w大小的cache,其緩存的是業務內部使用的user_id到用戶app上可見的display_id的映射關係,該映射關係在用戶創建時即生成固定不變,可以設置較長期時間,如果同時有效的對象數超過的maxlen,這個LocalCache直接就等價於一個LRU了,對象釋放可以完全依賴deque的先進先出淘汰機制。
在最開始評估其占用記憶體時考慮了以下因素:

  1. 單個k、v對 user_id最多20位元組,display_id最多8位元組,加上要存入的過期時間float欄位8位元組,總大小20+8+8=36,加上一些額外花銷最多100位元組
  2. 最大50w限制記憶體占用: 500000 * 100/1024 = 47.6MB
  3. 線上api服務為uWSGI框架提供的多進程運行方式,單機4個worker進程,總占用記憶體: 47.6 * 4 = 190MB
  4. 兩個LcoalCache占用記憶體: 190MB * 2 = 380MB

按照這個計算一臺主機即便每個進程都緩存滿了50w對象,也就增加不到400MB記憶體占用,何況按照估算同時處於有效期內的緩存對象應該遠小於50w,所以剩餘記憶體應當完全是綽綽有餘的,然而這個評估值其實遠小於實際值。

LocalCache占用記憶體的正確評估

線上出現記憶體問題後,嘗試使用tracemalloc分析了線上服務的記憶體分配情況,發現很多記憶體都集中於LocalCache這塊,於是結合實際重新評估這個記憶體占用,發現了以下問題:

  1. str與float的記憶體占用評估錯誤,即便str本身len只有10個字元,其占用記憶體其實是遠大於10的,而float並不是占用8位元組而是24位元組,如下代碼可驗證:
In [20]: len('0123456789')
Out[20]: 10
In [21]: sys.getsizeof('0123456789')
Out[21]: 59
In [23]: sys.getsizeof(time.time())
Out[23]: 24
  1. 即便是一個空dict其占用記憶體也有64位元組,而如果存入kv後則更是急速膨脹為至少232:
In [24]: sys.getsizeof({})
Out[24]: 64
In [26]: sys.getsizeof({'result': {'user_id_012345678901': 'display_id_ABCDEFGH'}, 'expire': time.time()})
Out[26]: 232
  1. 無論過期時間設置長短,由於存入該cache的對象資源回收完全是依賴於deque對其存入強引用的移除進行--即便對象按照時間已經過期了,但是只要deque中還存有該對象,對象就不會被回收--所以最終cache中緩存的對象一定會達到設置的maxlen,占用其理論上可占用的最大記憶體。

綜合以上幾點,雖然開始設置的過期時間較短,LocalCache中同時有效的對象數遠小於50w,但最終LocalCache還是會存滿50w的對象,同時實測LocalCache中存入一個對象的平均記憶體大小在700~800位元組,這樣一評估,最終這兩個cache單主機上需要占用的最大且肯定會達到的記憶體大小變成了: 700 * 500000 * 4 * 2 / 1024/1024 = 2.67GB,是之前錯誤評估值的6倍==!這樣一算主機上的記憶體就不夠用了。

後續處理

結合實際正確評估記憶體占用後,總結以下LocalCache使用原則:

  1. maxlen的設置需根據實際數據情況設置為合理值--如最大可能同時有效對象數的1.1 ~ 2.0倍,防止大量過期對象長期占用記憶體而不釋放的情況,check後確認線上代碼就有好幾處maxlen大於其最大有效對象數5~10倍的LocalCache使用。
  2. 拆分大對象與小對象同時使用的cache,因為占用幾百位元組的小對象的maxlen設置為1千、1萬甚至10w都合理,但是對於占用幾MB設置十幾MB的對象,maxlen設置>100就已經可能占用掉大量記憶體了。

針對api服務使用的多處LocalCache按照以上原則進行優化後,其占用的總記憶體量下降了超過3GB。

總結

在初版評估cache記憶體占用時,用了想當然評估法,而沒有實測每個類型、對象的實際占用大小,導致評估值遠小於實際值。
對於LocalCache的對象回收原理未深度理解,一直想當然認為只要過了有效時間其對象即會被回收掉,沒有認識到其回收完全依賴於deque。
又一次想當然造成的問題。

轉載請註明出處,原文地址: https://www.cnblogs.com/AcAc-t/p/python_local_cache_usage.html

參考

https://docs.python.org/3.8/library/tracemalloc.html
https://www.cnblogs.com/AcAc-t/p/python_weakref_study.html
https://docs.python.org/3.8/library/collections.html#collections.deque
https://www.cnblogs.com/AcAc-t/p/python_local_cache_usage.html
https://docs.python.org/3.8/library/sys.html?highlight=getsizeof

簽名:擁抱開源,擁抱自由
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 基於傳統認知,前端產品直接觸達消費者,往往具有高度的定製化、需求變更頻繁等特點,要求具有很好的動態性, 能夠滿足不同客戶的需求。那麼能否建設類似的前端中台產品,我們姑且稱之為“前端領域產品”,實現接入團隊端到端能力復用呢?我們在撮合業務線中進行了一系列思考和探索。 ...
  • 1. 使用 defineStore 創建一個 store, 每個 store 要設置一個唯一 id; ```ts import { defineStore } from 'pinia' import { ref } from 'vue' // useStore 可以是 useUser、useCart ...
  • 通過這個示例,你將更深入地瞭解如何在實際業務中應用Flutter,以及如何運用不同的解決方案和技術來構建高效、穩定的應用。 ...
  • # el-autocomplete核心參數 可以實現非同步的數據拉取,從非同步返回的數據中,選擇需要的結果,並回顯到文本框中。 ## fetch-suggestions 回調列表,非同步的方式獲取數據列表,顯示在列表框中 ## @select 當選中某一項時,會觸發這個方法,將數據獲取到,這時,我們可以將 ...
  • # 核心原理 長鏈接轉為短鏈接的核心原理是: 將短鏈接與原始長鏈接做一個映射,訪問短鏈接的時候,通過重定向的方式轉到長鏈接。 # 應用場景 比如分享功能,查看分享信息的原始鏈接通常是很長的,直接發給用戶,體驗不是很好,這時候就可以將其映射為一個短鏈接再發給用戶。 又比如我們熟知的百度網盤分享文件,雖 ...
  • ##一、定義 **講一個複雜對象的構建與它的表示分離,使得同樣的構建過程可以創建不同的表示。建造者模式是一種創建型模式。** ##二、描述 **包含以下四個角色:** ![](https://img2023.cnblogs.com/blog/1780813/202305/1780813-202305 ...
  • 你想成為一名架構師,對嗎?別對我撒謊,我知道你想成為架構師。即使你不想,你還是想成為一名更好的開發者。否則,你就不會花時間閱讀這篇文章。 這種態度值得贊賞。畢竟,我們都希望在自己所從事的領域變得更好,即使不能稱為最好。我在這裡就是為了幫助你實現這一目標。 那麼,你如何成為一名架構師呢?當然是通過學習 ...
  • #### 本文為[李你幹嘛](https://www.cnblogs.com/liniganma)原創,轉載請註明出處:[Pybind11綁定C++抽象類(DLL介面)](https://www.cnblogs.com/liniganma/p/17666063.html) # 摘要 假設我們將DLL ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...