聊聊大數據框架的數據更新解決方案: COW, MOR, MOW

-Advertisement-

大數據框架下，常用的數據更新策略有三種: COW: copy-on-write, 寫時複製; MOR: merge-on-read, 讀時合併; MOW: merge-on-write, 寫時合併; hudi等數據湖倉框架，常用的是前兩種實現數據更新。而Doris則主要用後兩種更新數據。 COW 在 ...

大數據框架下，常用的數據更新策略有三種:

COW: copy-on-write, 寫時複製;

MOR: merge-on-read, 讀時合併;

MOW: merge-on-write, 寫時合併;

hudi等數據湖倉框架，常用的是前兩種實現數據更新。而Doris則主要用後兩種更新數據。

COW

在數據寫入的時候，複製一份原來的拷貝，在其基礎上添加新數據,創建數據文件的新版本。新版本文件包括舊版本文件的記錄以及來自傳入批次的記錄(全量最新)。

正在讀數據的請求，讀取的是最近的完整副本，這類似Mysql 的MVCC的思想。

在java的類庫中就有一個CopyOnWriteArrayList，而linux的fork子進程的內部機制也是通過COW實現。可以說，COW是比較常用的數據更新方案。

MOR

新插入的數據存儲在delta log 中，定期再將delta log合併進行parquet數據文件。讀取數據時，會將delta log跟老的數據文件做merge。

這個merge的過程一般是多路歸併排序的實現：查詢時將重覆的 Key 排在一起，併進行聚合操作，其中高版本 Key 的會覆蓋低版本的 Key，最終只返回給用戶版本最高的那一條記錄。

hudi中，數據表的存儲類型主要是MOR,參考: Hudi-表的存儲類型及比較

MOW

將被覆蓋和被更新的數據進行標記刪除，同時將新的數據寫入新的文件。在查詢的時候，所有被標記刪除的數據都會在文件級別被過濾掉，讀取出來的數據就都是最新的數據，消除掉了讀時合併中的數據聚合過程，並且能夠在很多情況下支持多種謂詞的下推。

別的大數據框架我沒有查到相關的信息，這個的應用主要是在Doris的Unique數據模型中，即通過MOW實現了Unique數據模型下的數據更新。

Doris的MOW的實現方案是: Delete + Insert。即在數據寫入時通過一個主鍵索引查找到被覆蓋的 Key，將其標記為刪除。參考自微軟的 SQL Server 在 2015 年 VLDB 上發表的論文《Real-Time Analytical Processing with SQL Server》中提出的方案。

Delete + Insert

這篇論文提出了數據寫入時將舊的數據標記刪除（使用一個 Delete Bitmap 的數據結構），並將新數據記錄在 Delta Store 中，查詢時將 Base 數據、Delete Bitmap、Delta Store 中的數據 Merge 起來以得到最新的數據。整體方案如下圖所示

其優點是，任何一個有效的主鍵只存在於一個地方（要麼在 Base Data 中，要麼在 Delta Store 中），這樣就避免了查詢過程中的大量歸併排序的消耗，同時 Base 數據中的各種豐富的列存索引也仍然有效。

簡單來講，Merge-On-Write 的處理流程是：

對於每一條 Key，查找它在 Base 數據中的位置（rowsetid + segmentid + 行號）
如果 Key 存在，則將該行數據標記刪除。標記刪除的信息記錄在 Delete Bitmap中，其中每個 Segment 都有一個對應的 Delete Bitmap
將更新的數據寫入新的 Rowset 中，完成事務，讓新數據可見（能夠被查詢到）
查詢時，讀取 Delete Bitmap，將被標記刪除的行過濾掉，只返回有效的數據

總結

之所以會有這篇文章，主要是想總結一下大數據框架下常用的(準實時/實時)數據更新的常用解決方案，畢竟解決方案是通用的，只是實現方式會有差異。

關於更詳細的內容與實現，請參考:

10x 查詢性能提升，全新 Unique Key 的設計與實現

cow、mor與mow

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

SFX的妙用——如何在不安裝軟體的情況下打開自定義格式文件？

家中有閑置的小新，是A卡正好合適裝linux 安裝前關閉安全引導通過關機鍵旁邊的重置口重新開機 OR 在開機界面按F2（開啟Hotkey 模式的要按Fn+F2）進入BIOS 設置界面，關閉Secure Boot，這樣方便安裝linux 系統刻錄 linux有很多發行版大家可以自行選擇，推薦U ...
ssh~Server refused our key分析與解決

ssh介紹 SSH，全稱為Secure Shell，是一種用於在網路中安全地進行遠程登錄和執行命令的協議。它通過加密的方式提供了對網路通信的保護，使得用戶可以在不安全的網路環境下安全地進行遠程管理和數據傳輸。以下是 SSH 協議的一些重要特點和功能：安全性：SSH 使用加密技術來保護數據在網路中 ...
【資料庫概論】第五章資料庫完整性

資料庫完整性包括正確性和相容性，DBMS通過提供約束條件機制、檢查方法和違約處理功能維護資料庫完整性，其中實體完整性通過主鍵確保唯一標識，參照實體性通過外鍵關聯，用戶定義完整性滿足特定應用需求，而觸發器和斷言提供事件驅動和複雜約束支持，共同構成資料庫保持一致性的關鍵機制。 ...
【資料庫概論】第三章 SQL簡述、數據定義和索引

SQL（結構化查詢語言）的演變從IBM的SystemR開始，經過ANSI的標準化，近年來SQL標準變得更加豐富和複雜。SQL的特點包括綜合統一、高度非過程化、面向集合的操作方式以及提供多種使用方式的統一語法結構。在資料庫實例中，基本表獨立存在，而視圖是基本表導出的虛表，用於供人查看。資料庫模式結構包... ...
SQL ALTER TABLE 語句- 靈活修改表結構和數據類型

SQL ALTER TABLE 語句 SQL ALTER TABLE 語句用於在現有表中添加、刪除或修改列，也可用於添加和刪除各種約束。 ALTER TABLE - 添加列要在表中添加列，請使用以下語法： ALTER TABLE 表名 ADD 列名數據類型; 以下 SQL 向 "Customer ...
細說SQL與ETL之間的小秘密

本文分享自華為雲社區《GaussDB資料庫SQL系列-SQL與ETL淺談》，作者：Gauss松鼠會小助手2。一、前言在SQL語言中，ETL（抽取、轉換和載入）是一種用於將數據從源系統抽取到目標系統的過程。ETL過程通常包括三個階段：抽取（Extract）、轉換（Transform）和載入（Loa ...
數據資產入表在即，企業如何把握機遇，進行數據資產管理？

數據作為新時代重要的生產要素之一，數據資產化的相關工作正在提速。自今年10月1日起，中國資產評估協會制定的《數據資產評估指導意見》正式施行。同時，《企業數據資源相關會計處理暫行規定》近期轉為正式稿，也將於明年1月1日起施行。《暫行規定》規定：企業使用的數據資源，符合《企業會計準則第6號——無形資產 ...
掃盲Kafka？看這一篇就夠了！

解耦、削峰：傳統的方式上游發送數據下游需要實時接收，如果上游在某些業務場景：例如上午十點會流量激增至頂峰，那麼下游資源可能會扛不住壓力。但如果使用消息隊列，就可以將消息暫存在消息管道中，下游可以按照自己的速度逐步處理； ...