三篇論文入選國際頂會SIGMOD,厲害了騰訊雲資料庫

来源:https://www.cnblogs.com/tencentdb/archive/2022/06/14/16372903.html
-Advertisement-
Play Games

好消息!6月13日,騰訊雲資料庫三篇論文再次入選資料庫行業頂會SIGMOD,被SIGMOD 2022 Research Full Paper(研究類長文)收錄。 本次被收錄的研究成果中,新型數據結構設計、AI智能調參優化等均屬於業界首次提出。騰訊雲資料庫多次入選SIGMOD,表明騰訊雲資料庫在存儲、 ...


好消息!6月13日,騰訊雲資料庫三篇論文再次入選資料庫行業頂會SIGMOD,被SIGMOD 2022 Research Full Paper(研究類長文)收錄。

本次被收錄的研究成果中,新型數據結構設計、AI智能調參優化等均屬於業界首次提出。騰訊雲資料庫多次入選SIGMOD,表明騰訊雲資料庫在存儲、智能管控等方面的積累與前沿創新獲得了國際權威認可。

file

SIGMOD,全稱數據管理國際會議(Special Interest Group on Management Of Data),是由美國電腦協會(ACM)數據管理專業委員會(SIGMOD)發起、在資料庫領域具有最高學術地位的國際性學術會議。

第一篇入選論文題目為HUNTER: An Online Cloud Database Hybrid Tuning System for Personalized Requirements,由騰訊雲資料庫團隊和華中科技大學合作完成,在AI智能調參優化上取得進一步突破。

通俗理解,資料庫的參數設置多達幾百個,這些參數控制著資料庫的性能表現。專業運維人員會花大量時間,根據經驗來調優資料庫的參數,以匹配不同硬體、需求和業務場景。如何利用 AI 技術解決資料庫系統性能問題變得越來越重要和緊迫。

在此篇論文中,騰訊雲資料庫TDSQL-C團隊提出了混合調優系統Hunter,主要解決瞭如何在保證調優效果的前提下顯著減少調優時間的問題。實驗表明:隨著併發度提升實現調優時間準線性降低,在單併發度場景下調優時間只需17小時,在20併發度場景下調優時間縮短至2小時。

第二篇入選論文由中國人民大學和騰訊雲資料庫團隊合作完成,題為CompressDB: Enabling Efficient Compressed Data Direct Processing for Various Databases,論文針對壓縮數據的直接操作與處理,提出一項新型資料庫處理技術——CompressDB。

面對當下指數級增長的數據量,行業普遍使用數據壓縮來減少存儲空間。在大數據管理系統中,直接在壓縮數據上進行操作,可以獲得存儲空間的節約和處理性能的提升。但是,當前的此類系統只關註數據查詢,而一個完整的大數據管理系統必須支持數據查詢和數據操作。

本研究提出並實現了新型資料庫技術,利用上下文無關文法來壓縮數據,通過新的數據結構和演算法設計實現對語法規則進行解析,CompressDB支持直接對壓縮後的數據進行數據查詢和操作,並且支持各種資料庫系統。實驗表明,CompressDB 平均達到40%的吞吐量提升和44%的延遲縮短,並實現1.81倍的壓縮率。

第三篇入選論文由騰訊和北京大學合作完成,題為 BlindFL: Vertical Federated Machine Learning without Peeking into Your Data。針對數據隱私安全問題,該論文提出了一個新的縱向聯邦學習範式BlindFL,可支持多種特征數據類型,且可以在半誠實安全假設下證明其安全性。實驗結果表明,BlindFL可有效保護參與方的隱私數據,並具有更高的運行效率。

騰訊歷來重視資料庫領域的研發,通過校企聯合實驗室共建,面向青年學者的CCF-騰訊犀牛鳥基金,騰訊犀牛鳥科研專項等與高校、科研機構構建“產學研”一體的長期合作,將技術研究成果轉換為應用落地,校企聯合持續輸出前沿技術創新與示範性應用。

此前,騰訊雲資料庫TDSQL曾多次亮相資料庫三大頂會SIGMOD、ICDE、VLDB,以及數據科學領域的頂級期刊IEEE TKDE等。騰訊雲資料庫TDSQL將繼續加大對資料庫基礎研究創新、資料庫產學研合作生態的建設投入,充分釋放領先技術的紅利,助力國產資料庫學術人才培養和技術創新生態建設發展。

為幫助廣大資料庫愛好者更加詳細地瞭解論文內容,我們邀請到了中國人民大學副教授、博士生導師、騰訊犀牛鳥基金獲得者張峰老師,華中科技大學副研究員、互聯網+國賽金獎項目“資料庫智能管家的創新與探索”指導老師劉渝及騰訊 TEG 機器學習平臺部 Angel Graph 團隊應用研究員、北京大學電腦系在讀博士生張文濤老師來到直播間解讀。6 月 21 日 15:00,不見不散!

掃描海報二維碼或點擊閱讀原文,即刻報名參會!

file


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 線上問題年年有,今年特別多。記幾次線上慘痛的踩坑記錄,希望大家以史為鑒。 1. 包裝類型自動解箱導致空指針異常 public int getId() { Integer id = null; return id; } 如果調用上面的方法會發生什麼?id是Integer類型,而方法的返回值int類型, ...
  • 排版雖然只是繪圖中的輔助功能,但是好的排版能夠提高圖形的表現力。 讓人一眼看出圖形要表達的內容和數據,而不用去費力的睜大眼睛去圖中查找。 如果說 matplotlib的坐標系統,各種基礎元素,包括柱狀圖,折線圖,散點圖等它的硬實力, 那麼,排版就是 matplotlib 的軟實力,結合排版,能讓分析 ...
  • 本文是clickhouse專欄第五篇,更多內容請關註本號歷史文章! 一、數據類型表 clickhouse內置了很多的column數據類型,可以通過查詢system.data_type_families這張表獲取版本的所有支持的數據類型。下文中第一列是欄位類型,第二列表示該類型的欄位類型是否區分大小寫 ...
  • #region 輸入數字判斷是否是數字 #region 方法實現 /*不管是實參或形參,都在類型中開闢了空間的; 方法的功能一定要單一; 如GetMax(int n1,int n2); 方法中最忌諱的就是提示用戶輸入的字眼。 ///PS:最新版的沒有namespace這些,目前我想到的調用方法和類就 ...
  • #region 調用 /* 我們在main函數中調用Test()函數,我們管main函數稱為調用者, Test函數稱為被調用者. 如果被調用者想要得到調用者的值: 1) 傳遞參數; 2) 使用靜態欄位來模擬全局變數; 如果調用者想要得到被調用者的值: 1) 返回值; */ #endregion na ...
  • #region 複習 /* 常量:一旦賦值,不能被重新賦值; 枚舉:規範開發; 結構:為了一次性聲明多個不同類型的變數(實際為欄位); 數組:為了一次性聲明多個相同類型的變數 通過下標或索引訪問數組中元素 數組的取值和賦值 冒泡排序:兩個for迴圈 Array.Sort(nums);Array.Re ...
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 1.先查看本機的系統信息 [root@h0436 h0436 zlong]# cat /etc/redhat-release 2.進入yum.repos.d [root@h0436 zlong]# cd /etc/yum.repos.d 3.查看 ...
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 ifconfig 命令可以用於查看、配置、啟用或禁用指定的網路介面,還可以用來配置網卡的IP地址、掩碼、廣播地址、網關等,功能很豐富 功能雖然豐富,但是如果你沒有安裝呢? 嘿嘿嘿 如果沒有安裝ifconfig管理命令的話,直接運行ifconfig ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...