如何像用自來水一樣使用資料庫?|騰訊雲資料庫TDSQL-C

来源:https://www.cnblogs.com/tencentdb/archive/2022/08/02/16542997.html
-Advertisement-
Play Games

“如果說中小企業是一片片沿溪而耕的農田,那麼我們的願景就是建一座大壩來管理好上游的水資源,來灌溉下游企業。” 騰訊雲資料庫高級工程師楊珏吉說這是他投身資料庫領域的初衷。初創企業、中小企業在資料庫層面的最大需求就是低成本。助力企業降本增效是騰訊雲資料庫一直在努力的方向,尤其在疫情衝擊下的經濟社會中,更 ...


“如果說中小企業是一片片沿溪而耕的農田,那麼我們的願景就是建一座大壩來管理好上游的水資源,來灌溉下游企業。”

騰訊雲資料庫高級工程師楊珏吉說這是他投身資料庫領域的初衷。初創企業、中小企業在資料庫層面的最大需求就是低成本。助力企業降本增效是騰訊雲資料庫一直在努力的方向,尤其在疫情衝擊下的經濟社會中,更是一份社會責任。

在技術上深研,突破極致彈性,讓客戶像使用自來水一樣的使用資料庫,用多少、怎麼用由客戶決定,計費由使用量決定,這是楊珏吉及其團隊給出的答案。TDSQL-C Serverless 資料庫通過使用計算存儲分離架構,實現自動擴縮容、按使用量計費、無使用無計費功能,從而實現大幅降低成本,下麵將詳細介紹功能實現背後的架構原理及應用場景。

點擊此處觀看完整版視頻

一、產品特點

file

Serverless 分為 FaaS 和 BaaS,其中 FaaS 是函數即服務,也就是我們熟悉的雲函數,可以理解成是雲主機的一種抽象,免去了複雜的運維,幫助開發者自動擴縮容,實現服務的高可用,並按使用量計費。

BaaS 是後端即服務,比如對象存儲,它也免去了開發者的文件存儲管理的負擔,能提供足夠的彈性能力,實現按照使用量計費,所以它也滿足 Serverless 的要求。

目前雲資料庫的售賣方式還是與雲主機類似,開發者需要購買一個固定規格的雲資料庫,比如CPU 4 核記憶體 8G,即使開發者沒有 SQL 請求,也將按照 4 核 8G 進行計費。

file

業界場景的雲資料庫,確實幫助開發者實現了高可用和自動備份,減少了運維負擔,但開發者需要提前預測業務請求量,併發起擴縮容,也無法在沒有使用的時候不收費。

傳統雲資料庫同機部署計算和存儲,內核進程直接寫本地數據文件。當一臺機器的存儲使用已經接近 90%,即使整機存量實例的計算資源負載再低,也無法再分配新實例了。在這種情況下,該機器上存量實例的用戶,雖然沒有使用計算資源,CPU 記憶體都是 0,也依然要承擔此機器計算資源的費用。反過來也一樣,計算使用 90%,而存儲使用量較少,也將導致剩餘存儲無法再售賣。

按實際用量付費的問題本質是按實際用量分配資源。所以雲資料庫如果要邁向 Serverless 這個目標,要做的就是計算存儲分離。

計算存儲分離的優勢很多,比如存儲空間和寫帶寬能突破單機上限,更強的容災能力等等,本文重點講解資源分配彈性靈活的特點。

計算存儲分離能使計算和存儲解耦,任意計算節點能訪問任務的存儲節點。計算和存儲維護各自的資源池,分別最大化、最靈活地進行資源分配。存儲層按存放的數據量收費,計算層按真正的負載收費。

另一方面,傳統雲資料庫擴縮容需要搬遷數據到另一臺物理設備,所以耗時長。而計算存儲分離架構,計算層擴縮容不需要搬遷存儲層的數據,直接分配計算層資源即可,秒級完成擴縮容

在計算存儲分離之上,TDSQL-C 完成了 Serverless 產品功能的設計,讓我們來看看具體是怎麼做的。

二、架構設計

file

上圖是開發者訪問的全鏈路,應用程式通過接入層訪問計算層,計算層從存儲層返回數據。

我們的 Serverless 形態是利用監控計算層實現的。通過監控,我們對計算資源進行自動擴縮容,並對該時刻所消耗的資源進行計費。當發現沒有請求時,監控服務就會觸發計算資源的回收,並通知接入層。用戶再次訪問時,接入層則會喚醒實例,再次提供訪問。

file

從客戶角度總結起來就是三大特點:

自動擴縮容:根據業務負載擴縮容實例,開發者無需預測負載並提前擴容資源;

按使用量計費:以實際使用的負載進行計費,開發者無需為自己沒有使用到的資源付費;

無使用無費用:無數據請求時,不對計算資源計費。

1. 自動擴縮容

file

自動擴縮容的目標是讓客戶可以像使用自來水那樣使用資料庫,既可以一滴一滴,也可以像瀑布一樣傾瀉地用。

開發者在購買一個 Serverless 實例時,需要指定擴縮容的範圍,也就是最小和最大規格。比如開發者購買了一個最小 1 核 2G 最大 2 核 4G 的實例。我們對 CPU 和記憶體限制到最大規格,也就是說 CPU 和記憶體不存在擴容的時間,而 Buffer Pool 根據 CPU 負載定時調整。

這是一個我們最開始考慮的方案,也是比較業界常見的擴縮容方案。

上圖縱軸表示 CPU,橫軸表示記憶體(Mem),矩形框代表資源限制。實例閑時,就限制實例的規格為 1 核 2G,負載來臨時,CPU 迅速打滿,監控發現後,再觸發擴容,擴成 2 核 4G,其中緩存也是 BP 大小也相應增加,可以看到在擴容發生之前,用戶的 CPU 使用是受到限制的,限制的時間取決於觸發擴容的閾值。

file

我們後來採用的方案則是一開始就限制到最大規格,負載來臨時,可以一下子使用到更多的資源,然後根據 CPU 的使用量來觸發緩存大小的更新。在這個方案下用戶使用資料庫可以無感知進行 CPU 擴容,並且也不會因為鏈接突增導致實例 OOM。

2. 按使用量計費

file

使用量計費的目標是秒級別的計費粒度,以及任意單位的資源規格,比如用到 0.7 核,就按 0.7 核收費,而不是不足 1 核算 1 核。

我們的監控室每 5 秒採集一次,採集結果統一使用 CCU(TDSQL-C Compute Unit)作為統一的算力單位,其計算方法為 CPU、記憶體的1/2以及最小規格三者取最大值。

以上圖為例,閑時以最小規格 0.25 CCU 計費,負載來臨時以 CPU 進行收費,即為 3;當負載結束時,記憶體還在釋放,為記憶體的1/2 ,也就是 0.8。

3. 無使用無計費

file

問題來了,大家可能覺得閑時按最小 0.25 CCU 計費也還是多了,於是我們推出無使用無費用的功能。

10 分鐘沒有收到用戶連接,就將回收計算節點,轉為暫停的實例。暫停的實例收到用戶請求後,啟動計算節點,恢復為運行中的實例。

我們通過監控計算的連接數,沒有連接則向管控發起暫停。

file

暫停後,我們回收了計算層所有資源,不再對計算資源收費,僅對存儲資源進行收費。接入層收到用戶請求後,管控則會啟動實例,提供給用戶訪問。

file

這當中比較重要的是恢復時間,也就是冷啟動時間。在恢復時間上,我們做了相當多的優化,包括找持久化的日誌位點以及 BP 和事務系統的初始化。目前,恢復時間能做到僅需2秒

有的讀者可能會感興趣計算存儲分離的架構細節,接下來簡要分享一下架構細節。

file

在計算層,我們使用的是的 TXSQL,完全相容 MySQL 協議,能夠復用社區的 bugfix 和特性。主從複製使用 redo 複製,優點是延遲低。redo 日誌不落在本地,而是發送給存儲層。

在存儲層,我們使用的是雲硬碟的 HiStore 存儲平臺,保障了數據安全、GB 級別的備份回檔、以及性能與成本的多種存儲選擇方案,我們在 HiStore 中加入資料庫的邏輯,實現日誌回放以及運算元下推。

大家如果不熟悉資料庫也不要被這個這些名詞嚇到,我們對外其實就是提供的是與 MySQL 一致的資料庫服務,區別是內部我們做了計算存儲分離,分離之後計算層的資源可以更自由、靈活地分配

三、應用場景

應用場景是廣大開發者比較關心的,接下來給大家分享六類場景的實際應用。

1. 慢查詢

file

當開發者的 SQL 優化得不夠好,或者偶爾需要全表掃描分析數據時,就會出現慢查詢,與慢查詢相伴的往往是 CPU 使用率高(因為掃描的數據比較多)。

這也是用戶能切實感知到的,從上圖的監控中可以看到慢查詢與 CPU 是正相關的。如果用戶購買一個比較大的固定規格的實例,那麼將承擔額外的成本;如果購買的是小規格實例,那麼在慢查詢到來時用戶的 CPU 會被占滿,進而影響業務。使用Serverless 資料庫就不用擔心這個問題,大部分時間Serverless 資料庫以低 CCU 進行付費,慢查詢來臨的時候可以立刻用到額外的 CPU,所以整體上也只是影響慢查詢時刻的計費

2. 定時任務

file

與慢查詢類似,有相當多的業務都有定時處理邏輯,包括定時清理舊數據、定時生成前一天的報表等。上圖可以看到,用戶在每天 0 點會跑非常多的請求,但平時大部分時間是一個低負載。用戶使用了 Serverless 資料庫之後,也不用去對規格和費用做權衡了,和上一個例子一樣,用多少就計費多少

3. 歸檔資料庫

file

如果長時間不用資料庫,就不用對 CPU 和記憶體進行收費。這類通常見於一些檔案資料庫、機器學習的樣本資料庫、個人家庭的歷史感測器資料庫等,不會經常使用,而是偶爾訪問的狀態。這類數據的常見的做法是直接存在 COS 里,需要的時候去下載。而Serverless 資料庫有一個很大的優點就是需要的時候立刻能夠提供索引,且擁有強大的分析功能,開發者不需要自己去寫代碼就能搜索到需要的數據

4. 低頻訪問的業務

file

對於平均每天的訪問量小於 10 次的低頻訪問業務,例如個人博客、垂直社區論壇、微信小程式,我們與雲函數、雲開發、微信雲托管有深入合作,能實現訪問結束後就停止計費

5. 開發測試環境

file

上圖可以看到在一周時間內,用戶在晚上、周末都沒有訪問和使用。用戶通過 TDSQL-C Serverless 資料庫的自動暫停功能,節省了大量研發測試成本

6. 微服務場景

file

隨著微服務越來越流行,每個單獨的服務負責的功能也越來越小,隨之對應的是微服務後端的資料庫的負載也會變小。一種做法是多個微服務共用一個大的資料庫,但這會帶來相互影響的問題。所以,Serverless 資料庫提供小規格的資料庫實例,來保證微服務之間的隔離性

四、總結與展望

TDSQL-C Serverless 補充了資料庫領域中 Serverless 的空白。在自動擴縮容上,可以使 CPU 瞬間用到最大規格,按使用量計費上能夠按 CPU 實時的使用量進行計費,不使用不計費上冷啟動時間是 2 秒,目前在 Serverless 資料庫中是絕對領先的。未來我們也會在冷啟動上做進一步的優化,以及幫助客戶進一步降低使用成本。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Mac圖片無損放大軟體哪款好用?Topaz Gigapixel AI for Mac是Mac平臺上一款圖片無損放大軟體,使用AI人工智慧來擴展圖像。topaz gigapixel AI為用戶提供無損放大的圖像,同時還增加了自然細節損失處理,可以放大和填充圖像調整產品,而不使圖片失真! 詳情:Topa ...
  • 好久沒寫博客了,最近挺忙的。近來有些好玩的實現,網上的資料並不是非常詳細,打算慢慢寫下來,希望別人能少走一點彎路。 因為希望提高ADC的採樣率,這次我試著實現了一下三重ADC交替採樣+DMA搬運至記憶體+TIM的TRGO觸發採樣(環境是stm32cubemx 6.5.0和keil 5) 首先打開cub ...
  • 喜歡音樂的朋友們想要快速進行音樂樂譜的學習麽?iReal Pro 是一款Mac上優秀的音樂學習和參考工具, 可以模擬出一支虛擬樂隊伴隨您練習,從30種不同風格的伴奏中選擇,包括50套練習曲,用於練習一般和弦進階,總之,iReal Pro是一款非常強大的音樂練習工具,音樂愛好者們一定要試試這款軟體。 ...
  • mobatek主要為電腦專業人士研究強大、安全且具有成本效益的軟體,主要產品包括:MobaXterm(適用於Windows的X伺服器和SSH客戶端)、MobaSSH(使用Unix工具為Windows增強的SSH伺服器)以及一些免費軟體......... ...
  • head.s 參考 [github這個博主的][ https://github.com/sunym1993/flash-linux0.11-talk ] 改變棧頂位置 _pg_dir: startup_32: movl $0x10,%eax mov %ax,%ds mov %ax,%es mov % ...
  • lamp 1. lamp簡介 有了前面學習的知識的鋪墊,今天可以來學習下第一個常用的web架構了。 所謂lamp,其實就是由Linux+Apache+Mysql/MariaDB+Php/Perl/Python的一組動態網站或者伺服器的開源軟體,除Linux外其它各部件本身都是各自獨立的程式,但是因為 ...
  • 上篇文章介紹瞭如何創建合適的MySQL索引,今天再一塊學一下如何更規範、更合理的使用MySQL? 合理規範的使用MySQL,可以大大減少開發工作量和線上問題,並提升SQL查詢性能。 我精心總結了這16條MySQL規約,分享給大家,歡迎評論指正。 ...
  • 大數據發展到今天,扮演了越來越重要的作用。數據可以為各種組織和企業提供關鍵決策的支持,也可以通過數據分析幫助發現更多的有價值的東西,如商機、風險等等。 在數據治理工作開展的時候,往往會有一個專門負責數據治理工作的負責人,他和大數據的負責人共同保證數據的可靠性,合法合規性。因為只有這樣的數據才是有價值 ...
一周排行
    -Advertisement-
    Play Games
  • Dapr Outbox 是1.12中的功能。 本文只介紹Dapr Outbox 執行流程,Dapr Outbox基本用法請閱讀官方文檔 。本文中appID=order-processor,topic=orders 本文前提知識:熟悉Dapr狀態管理、Dapr發佈訂閱和Outbox 模式。 Outbo ...
  • 引言 在前幾章我們深度講解了單元測試和集成測試的基礎知識,這一章我們來講解一下代碼覆蓋率,代碼覆蓋率是單元測試運行的度量值,覆蓋率通常以百分比表示,用於衡量代碼被測試覆蓋的程度,幫助開發人員評估測試用例的質量和代碼的健壯性。常見的覆蓋率包括語句覆蓋率(Line Coverage)、分支覆蓋率(Bra ...
  • 前言 本文介紹瞭如何使用S7.NET庫實現對西門子PLC DB塊數據的讀寫,記錄了使用電腦模擬,模擬PLC,自至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1.Windows環境下鏈路層網路訪問的行業標準工具(WinPcap_4_1_3.exe)下載鏈接:http ...
  • 從依賴倒置原則(Dependency Inversion Principle, DIP)到控制反轉(Inversion of Control, IoC)再到依賴註入(Dependency Injection, DI)的演進過程,我們可以理解為一種逐步抽象和解耦的設計思想。這種思想在C#等面向對象的編 ...
  • 關於Python中的私有屬性和私有方法 Python對於類的成員沒有嚴格的訪問控制限制,這與其他面相對對象語言有區別。關於私有屬性和私有方法,有如下要點: 1、通常我們約定,兩個下劃線開頭的屬性是私有的(private)。其他為公共的(public); 2、類內部可以訪問私有屬性(方法); 3、類外 ...
  • C++ 訪問說明符 訪問說明符是 C++ 中控制類成員(屬性和方法)可訪問性的關鍵字。它們用於封裝類數據並保護其免受意外修改或濫用。 三種訪問說明符: public:允許從類外部的任何地方訪問成員。 private:僅允許在類內部訪問成員。 protected:允許在類內部及其派生類中訪問成員。 示 ...
  • 寫這個隨筆說一下C++的static_cast和dynamic_cast用在子類與父類的指針轉換時的一些事宜。首先,【static_cast,dynamic_cast】【父類指針,子類指針】,兩兩一組,共有4種組合:用 static_cast 父類轉子類、用 static_cast 子類轉父類、使用 ...
  • /******************************************************************************************************** * * * 設計雙向鏈表的介面 * * * * Copyright (c) 2023-2 ...
  • 相信接觸過spring做開發的小伙伴們一定使用過@ComponentScan註解 @ComponentScan("com.wangm.lifecycle") public class AppConfig { } @ComponentScan指定basePackage,將包下的類按照一定規則註冊成Be ...
  • 操作系統 :CentOS 7.6_x64 opensips版本: 2.4.9 python版本:2.7.5 python作為腳本語言,使用起來很方便,查了下opensips的文檔,支持使用python腳本寫邏輯代碼。今天整理下CentOS7環境下opensips2.4.9的python模塊筆記及使用 ...