如何給一個 HTAP 資料庫做基準測試?StoneDB學術分享會第4期

来源:https://www.cnblogs.com/yangwilly/archive/2022/10/22/16816965.html
-Advertisement-
Play Games

在最新一屆國際資料庫頂級會議 ACM SIGMOD 2022 上,來自清華大學的李國良和張超兩位老師發表了一篇論文:《HTAP Database: What is New and What is Next》,並做了 《HTAP Database:A Tutorial 的專項報告。這幾期學術分享會的文 ...


file

在最新一屆國際資料庫頂級會議 ACM SIGMOD 2022 上,來自清華大學的李國良和張超兩位老師發表了一篇論文:《HTAP Database: What is New and What is Next》,並做了 《HTAP Database:A Tutorial 的專項報告。這幾期學術分享會的文章,StoneDB 將系統地梳理一下兩位老師的報告,帶讀者瞭解 HTAP 的發展現狀和未來趨勢。

在《深度乾貨!一篇 Paper 帶您讀懂 HTAP》這期中我們對HTAP產生的背景和現有的HTAP資料庫及其技術棧做了比較全面的介紹。

在《爆肝整理 5000 字!HTAP 的關鍵技術有哪些?》這一期,我們對 HTAP 的五大關鍵技術進行了逐個解讀。

本期主要介紹一下主流的幾個的 HTAP 資料庫基準測試。

編輯:宇亭

頭圖:Yeekin

關於 HTAP 資料庫的基準測試,我們在學術分享會的第三期也介紹過一個來自慕尼黑工業大學 DB 組的相關工作,感興趣可以瞭解一下,在這篇報告中,主要介紹兩種:CH-Benchmark 和 HTAPBench。
Overview of HTAP Benchmarks

如圖所示,這兩種基準測試的核心區別在於,CH-Benchmark 是混合負載測試,即 OLTP 和 OLAP 一起測;HTAPBench 是先固定統一 OLTP 的標準,然後在這個標準下再去控制測試 OLAP(當然還多了一個時間視窗的選擇)。

這裡順便簡單科普一下什麼是 TPC-C 和 TPC-H:

先介紹一下 TPC 是啥,TPC(Transaction Processing Performance Council,事務處理性能委員會)是由數十家會員公司創建的非盈利組織,總部設在美國。TPC 的成員主要是電腦軟硬體廠家,而非電腦用戶,其功能是制定商務應用基準程式的標準規範、性能和價格度量,並管理測試結果的發佈,其他更多信息就可以百度啦,總之這個組織在國際上很有影響力,學術界和工業界也都蠻認可的。

  • TPC-C: TPC Benchmark C 於1992年7月批准,是一個線上交易處理(OLTP)基準。TPC-C 比以前的 OLTP 基準測試(如TPC-A)更複雜,因為它具有多種事務類型、更複雜的資料庫和整體執行結構。TPC-C 涉及五個不同類型和複雜度的併發事務的混合,要麼線上執行,要麼排隊等待延遲執行。資料庫由九種類型的表組成,這些表存儲的記錄多而廣泛。TPC-C 以每分鐘事務數(tpmC)來衡量。雖然基準描述了批發供應商的活動,但 TPC-C 並不局限於任何特定業務部門的活動,而是代表必須管理、銷售或分銷產品或服務的任何行業。官網:https://www.tpc.org/tpcc/default5.asp
  • TPC-H: TPC-H 是 TPC 組織制定的 OLAP 型資料庫管理系統性能測試的一個標準,用來模擬真實商業的應用環境,以評估商業分析中決策支持系統(DSS)的性能。TPC-H 模擬真實商業交易資料庫的動態查詢,包含了一整套面向商業的 ad-hoc 查詢和併發數據修改,強調測試的操作系統、資料庫、和 I/O 性能,關註查詢能力。通過TPC-H 測試,可以全方位評測系統的整體商業計算綜合能力,具有普遍的商業實用意義。官網:https://www.tpc.org/tpch/

簡單說,TPC-C 是專門測試 OLTP 的;TPC-H 是專門測試 OLAP 的。當然,其實還有個 TPC-DS 也比較知名(現在一般用來測數倉的),感興趣也可以瞭解一下。

雖然以上兩種測試基準已經非常給力,但是對於測試 HTAP 卻又都顯得片面了一些,因為 HTAP 資料庫上是同時跑著 OLTP 和 OLAP 工作負載的,單獨只考量 OLTP 或者 OLAP 的性能都是不對的,要測就得綜合評估兩者一起工作時的性能(比如 TP 和 AP 的隔離性),因此,後續有人提出了專門針對 HTAP 資料庫的基準測試,其中比較知名的就是 CH-Benchmark 和 HTAPBench。

這兩個測試基準單獨拿出來都能寫一篇文章,但在報告中其實只有兩段話,我這一篇解讀文章先做一個簡單的介紹,後面會出擴充的講解,歡迎大家關註 StoneDB 公眾號。
file

一、CH-Benchmark

CH-Benchmark

在 CH-Benchmark 中結合了 TPC-C 和 TPC-H 兩種基準,它把原來 TPC-C 中的 9 個表和 TPC-H 中的 8 個表修改合併成了 12 個表,並將兩者的伸縮模型也統一起來(Scaling TPC-H by the same factors of TPC-C)。

這裡小編來解釋一下,TPC-C 和 TPC-H 遵循不同的伸縮模型。TPC-C 遵循連續伸縮模型,倉庫表中的數據隨著系統性能的增加而增加。相反,TPC-H 遵循固定比例因數模型,其中資料庫大小由比例因數設置,而與系統性能無關。在 CH-Benchmark 中要求令 TPC-H 的伸縮模型去與TPC-C的伸縮模型相適應(以TPC-C的伸縮模型為基礎),也就是要求根據TPC-C規則,去設定各表(Warehouse, Stock, Item, History, Neworder, Orderline, District, Customer, and Order)的規模。

關於查詢語句,有三點大的修改:

  1. 保留了 TPC-C 中的五個事務:新訂單(New Order) :客戶輸入一筆新的訂貨交易;支付操作(Payment) :更新客戶帳戶餘額以反映其支付狀況;發貨(Delivery) :發貨(模擬批處理交易);訂單狀態查詢(Order Status) :查詢客戶最近交易的狀態;庫存狀態查詢(Stock Level) :查詢倉庫庫存狀況,以便能夠及時補貨。
  2. 修改了 TPC-H 的 22 條查詢,修改了 table name 和 join key,並減少了算術運算。
  3. 刪掉了刷新函數(refresh functions)

file

1 CH-Benchmark 的執行規則

  • 先僅測試 OLTP 或 OLAP,然後混合執行(OLTP+OLAP)
  • 控制 OLTP 和 OLAP 並行流的個數(The number of parallel OLTP and OLAP streams)

這裡就是需要用到基準參數控制 OLTP 和 OLAP 工作負載的併發執行。

2 CH-Benchmark 評測度量的性能指標

這裡提出了一種基於參照系的評測指標,主要是結合每分鐘事務(tpmC,transactions per minute)和每小時已完成查詢(QphH,queries per hour)的指標。

  • 面向 OLAP 的指標(OLAP 占據主導):

file

  • 面向 OLTP 的指標(OLTP 占據主導):

file

為了進行這一比較,我們首先從 n 個 OLTP 和 m 個 OLAP 流隔離運行的運行中計算 tpmC 和 QphH 測量值之間的比率。然後,我們將此比率與並行執行 n 個 OLTP 和 m 個 OLAP 流的混合工作負載所產生的比率進行比較。與獨立運行工作負載部分相比,並行執行的比例更高,這意味著資料庫系統在並行執行中為 OLTP 事務提供更好的服務。

舉個慄子:隔離執行為 5.7@5084 tpmC,混合執行為 6.5@5188 tpmC,這表示混合執行增加了 OLTP 吞吐量。

參考論文Cole R, Funke F, Giakoumakis L, et al. The mixed workload CH-benCHmark[C]//Proceedings of the Fourth International Workshop on Testing Database Systems. 2011: 1-6.
file

二、HTAPBench

1 HTAPBench 的模式和工作負載

這一塊是和 CH-Benchmark(TPC-C + TPC-H)一樣的,不贅述了。

2 HTAPBench 的執行規則

  • Fixed target tpmC with controllable OLAP workers
    file

固定 OLTP (tpmC)為首要目標,然後動態地控制 OLAP 的 Worker 線程。這種方式在執行過程中會根據 OLTP 的實時吞吐量來調整添加 OLAP 工作流,由此測試出在固定 OLTP 性能下能獲得的最大 OLAP 性能。

  • Time window for querying newly-inserted data(查詢新插入數據的時間視窗)
    file

優勢是增加了時間視窗的選擇。Time window 這個不知道大家熟不熟悉,所謂時間視窗,就是根據時間劃分視窗,是將指定時間範圍內的所有數據組成一個 window,一次對一個 window 裡面的所有數據進行計算。詳細的不展開講了,後續我把這篇論文拿出來解讀一下子。

3 HTAPBench 評測度量的性能指標:

Under a certain TP throughput, the AP throughput per hour per worker(在一定 TP 吞吐量下,每個 Worker 每小時的 AP 吞吐量)
file

參考論文Coelho F, Paulo J, Vilaça R, et al. Htapbench: Hybrid transactional and analytical processing benchmark[C]//Proceedings of the 8th ACM/SPEC on International Conference on Performance Engineering. 2017: 293-304.

file

三、對比

file
Comparison of HTAP End-to-End Benchmarks

  • CH-Benchmark:
    • 優勢:易用、執行靈活
    • 劣勢:數據新鮮度較低
  • HTAPBench:
    • 優勢:數據新鮮度高
    • 劣勢:固定了 OLTP 的指標

file

四、其他 HTAP 測試標準

首先介紹一下端到端(End-to-End)的 HTAP 評測基準,比如:

Swarm64 HTAP benchmark

稍早的有 Swarm64 HTAP benchmark:

  • 結合了 CH-benchmark 和 HTAPBench
  • 採用了 CH-benchmark 中的混合執行規則
  • 採用了 HTAPBench 中的動態時間視窗。

Github地址:https://github.com/swarm64/s64da-benchmark-toolkit

OLxPBench

最近在 ICDE 2022 上 Kang 提出了 OLxPBench,這種基準測試有三個方法:Su-benchmark(TPC-C)、Fi-Benchmark(small-bank,面向小型銀行)、Tabenchamark(TATP,面向電信行業)。

參考論文Kang G, Wang L, Gao W, et al. OLxPBench: Real-time, Semantically Consistent, and Domain-specific are Essential in Benchmarking, Designing, and Implementing HTAP Systems[J]. arXiv preprint arXiv:2203.16095, 2022.

HATrick

來自威斯康辛大學 Miklai 在 SIGMOD 2022 新提出了一個叫 HATrick Benchmark 的混合基準。這個 HATrcik 融合了兩個新的性能指標:吞吐邊界(Throught frontier)和面向查詢的新鮮度(Query-Driven Freshness)。

目前流行的HTAP基準包括 CH-Benchmark、HTAPBench 和 Swarm64。但在測試中有著以下的限制:無法測量性能隔離;無法測量新鮮度;無法識別設計類別。HATtrick benchmark 作為一個開源項目,補充了吞吐量前沿,整合了新鮮度測量方法,可以有效評測 HTAP 系統。

吞吐量:該概念的引入是為了捕捉事務處理和分析處理的性能。通過在2D圖表中可視化吞吐量邊界,我們可以理解 HTAP 系統的整體性能行為,並識別出問題所在。
file
Throught frontier

如上圖,X 軸就是事務的吞吐,Y 軸就是分析的吞吐。這兩張圖怎麼看的呢?簡單來說,就是第一幅圖中綠色曲線靠近紅色對角線,表示系統相對穩定;第二張圖中綠色曲線遠離紅色對角線,表示 AP 和 TP 兩者工作負載受干擾較大。

新鮮度:該指標的設計,是為了捕捉HTAP系統對實時分析的支持程度。鬆散地說,HTAP系統的新鮮度是對OLAP查詢可見的資料庫更新的延遲度量。
file
參考論文Milkai E, Chronis Y, Gaffney K P, et al. How Good is My HTAP System?[C]//Proceedings of the 2022 International Conference on Management of Data. 2022: 1810-1824.

Micro-benchmarks

除了端到端(End-to-End)的HTAP基準,還有一些特別針對數據組織(data organization,為啥特別要針對這個?因為數據組織是 HTAP 的五大關鍵技術之一的微型基準測試(Micro-benchmarks),比如:

  • ADAPT Benchmark [Arulraj et al, SIGMOD 2016]

file
插入數據後簡單的對一些列數據進行 select 操作。

  • HAP Benchmark [Athanassoulis et al, VLDB 2019]

file
這個就是在 select 基礎上增加了一些 insert、delete 和 update 操作。

好了,以上就是本期的分享內容,歡迎點贊收藏轉發,咱們下一期再見~

StoneDB 代碼已完全在 Github 開源,歡迎關註:

https://github.com/stoneatom/stonedb

StoneDB 官網:

_https://stonedb.io/


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 腳本介紹 下方是演示的表結構: CREATE TABLE `index_test03` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `name` varchar(20) NOT NULL, `create_time` varchar(20) NOT NULL ...
  • 1. 前言 今天 ChokCoco 大佬發佈了一篇博客 超強的蘋果官網滾動文字特效實現,iPhone 我是買不起的,但不妨礙我對抄特效感興趣,正好我這周安排的工作已經完成了,於是有空練練手實現了一個 WPF 版本。最終效果如下: 2. 原理 這個特效的原理在 ChokCoco 的文章里已經講解得很詳 ...
  • 前序 由於去年的一個項目需要在PDF 添加公司二維碼 ,當時在網上找了很多操作PDF方案,第一種Aspose.PDF,很遺憾 Aspose.PDF 有添加版權的背景還是頁腳我忘記了,不適合公司項目,最終放棄此方案。第二種FreeSpire.PDF,很遺憾Free有限制放棄了,第三種選擇OpenXml ...
  • 前序 前段時間由於項目需要用到MongoDB,但是MongoDB不建議Collection join 查詢,網上很多例子查詢都是基於linq 進行關聯查詢。但是在stackoverflow找到一個例子,程式員的朋友們請善於利用google搜索。主要介紹一個查詢角色的所有用戶的例子。MongoDB創建 ...
  • Bomb Lab 引言:主要任務是“拆炸彈”。所謂炸彈,其實就是一個二進位的可執行文件,要求輸入六個字元串,每個字元串對應一個phase。如果字元串輸入錯誤,系統就會提示BOOM!!!解決這次實驗需要將二進位文件反彙編,通過觀察理解彙編語言描述的程式行為來猜測符合條件的字元串。可以看出該可執行程式要 ...
  • 大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是i.MXRT中FlexSPI外設不常用的讀選通採樣時鐘源 - loopbackFromSckPad。 最近碰到一個客戶,他們在 i.MXRT500 上使能了 FlexSPI->MCR0[RXCLKSRC] = 2(即 loopbackF ...
  • 前言:在zookeeper學習的時候,執行jsp命令查看zookpper運行狀態的時候發現報錯: -bash: jps: command not found 翻閱了一大批文章,不是東拼西湊,就是缺斤少兩,於是乎,本人萌生了第一次寫博客的想法,復盤的同時,順便記錄一下此次踩坑的經過,開始吧,GOGOG ...
  • ST-LINK 連接失敗的因素,以我個人的經歷而言有兩種:一個是驅動問題,一個是插線問題。連接正常的情況如下圖所示,SWDIO 能顯示你的設備信息: 註意使用 SW 埠,JTAG 埠導致無法識別設備。還有一個註意點:使用 STM32CubeMX 配置工程的時候要把 SYS -> Debug 設置 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...