近日,由天翼雲科技有限公司雲網產品事業部天璣實驗室撰寫的《關於公有雲區分負載QoS感知的記憶體資源動態超分管理優化》(Thoth:Provisioning Overcommitted Memory Resource with Differentiated QoS in Public Clouds)論文... ...
近日,由天翼雲科技有限公司雲網產品事業部天璣實驗室撰寫的《關於公有雲區分負載QoS感知的記憶體資源動態超分管理優化》(Thoth:Provisioning Overcommitted Memory Resource with Differentiated QoS in Public Clouds)論文被2023年第25屆國際高性能計算與通信會議 IEEE HPCC(IEEE International Conference on High Performance Computing and Communications)長文收錄。
IEEE HPCC,是高性能計算領域較高水平的國際學術會議,也是中國電腦學會CCF推薦的國際會議之一。HPCC 由IEEE、IEEE電腦協會和IEEE 可擴展計算技術委員會(TCSC)支持,平均每年收到數百篇來自世界各地的論文投稿,每篇論文均經過2~4位同行專家的評審,近三年的論文接收率分別為16.4%(2022年)、21.1%(2021年)、15%(2020年)。此次天璣實驗室論文被收錄,意味著天翼雲技術創新能力再獲頂-級權威機構認可。
論文信息
Thoth: Provisioning Overcommitted Memory Resource with Differentiated QoS in Public Clouds. Proceedings of the 25th IEEE International Conference on High Performance Computing and Communications, Melbourne, Australia, December, 2023.
公有雲場景下,租戶通常會為業務負載分配比實際使用更多的記憶體來處理負載的峰值記憶體需求,但該舉措容易導致大部分記憶體資源長期處於閑置浪費的狀態。雖然之前的研究工作已經提出了各種各樣的記憶體調整方案,以試圖在動態記憶體資源調節期間保證工作負載的性能,但其均以基於SSD的頁面交換技術作為性能的唯/一托底手段,並伴隨負載性能大幅劣化的風險。近年來,隨著RDMA、CXL等跨機高速互聯通信技術的發展,跨物理伺服器的分離式記憶體技術受到廣泛關註。
本論文提出了一種機架級記憶體資源編排器Thoth,它考慮到不同負載關於記憶體資源的性能敏感性差異,採用公平負載QoS感知的記憶體調整策略,以確保每個物理伺服器中所有共置工作負載之間的差異化性能,同時機會性地利用機架內可用的遠端記憶體來緩解單機記憶體不足場景下,因觸發傳統基於SSD的記憶體頁面交換而導致的性能下降。
Thoth同時採用基於資源借貸的“信用”(credits)機制進行資源的動態分配,以在機架內各物理伺服器以及各共置虛擬機之間保障關於記憶體資源分配的長期公平性,從而儘可能減少資源饑餓與性能波動。根據該方法在TeleCloudOS4.0中的實測數據結果表明,通過對數據中心環境中典型的雲應用負載進行真實壓測,Thoth可在記憶體超分場景下將時延敏感工作負載的性能平均提高3倍左右,且能夠減少對共置批處理工作負載的性能影響。
天璣實驗室團隊介紹
天璣實驗室團隊於2022年初成立,是一支充滿活力和技術追求、極具創造力的青年團隊,團隊主要由北京大學、清華大學、中科院大學等名校碩博研究生和具有深厚技術能力的中-級、高-級、專家人才構成。
天璣實驗室團隊始終堅持科技創新,集智攻堅關鍵核心技術,為築牢國雲底座而不懈努力。天璣實驗室團隊在資源智能調度與運營方面助力TeleCloudOS4.0升級,以低碳發展、降本增效為目的,建設綠色新雲網、助推綠色新運營。目前,天璣實驗室團隊已發表專利20餘篇,榮獲中國信通院“新綠杯”優秀獎。
未來,天翼雲將堅持科技創新,加強關鍵技術攻關,以領先的產品能力夯實數字基礎設施底座,助力千行百業的數字化轉型。