MySQL 分庫分表方案,總結太全了。。

来源:https://www.cnblogs.com/javastack/p/18155675
-Advertisement-
Play Games

來源:https://www.cnblogs.com/405845829qq/p/7552736.html 前言 公司最近在搞服務分離,數據切分方面的東西,因為單張包裹表的數據量實在是太大,並且還在以每天60W的量增長。 之前瞭解過資料庫的分庫分表,讀過幾篇博文,但就只知道個模糊概念, 而且現在回想 ...


來源:https://www.cnblogs.com/405845829qq/p/7552736.html

前言

公司最近在搞服務分離,數據切分方面的東西,因為單張包裹表的數據量實在是太大,並且還在以每天60W的量增長。 之前瞭解過資料庫的分庫分表,讀過幾篇博文,但就只知道個模糊概念, 而且現在回想起來什麼都是模模糊糊的。

今天看了一下午的資料庫分庫分表,看了很多文章,現在做個總結,“摘抄”下來。(但更期待後期的實操) 會從以下幾個方面說起:

第一部分:實際網站發展過程中面臨的問題。

第二部分:有哪幾種切分方式,垂直和水平的區別和適用面。

第三部分:目前市面有的一些開源產品,技術,它們的優缺點是什麼。

第四部分:可能是最重要的,為什麼不建議水平分庫分表!?這能讓你能在規劃前期謹慎的對待,規避掉切分造成的問題。

推薦一個開源免費的 Spring Boot 實戰項目:

https://github.com/javastacks/spring-boot-best-practice

名詞解釋

庫:database;表:table;分庫分表:sharding

資料庫架構演變

剛開始我們只用單機資料庫就夠了,隨後面對越來越多的請求,我們將資料庫的寫操作和讀操作進行分離, 使用多個從庫副本(Slaver Replication)負責讀,使用主庫(Master)負責寫, 從庫從主庫同步更新數據,保持數據一致。架構上就是資料庫主從同步。 從庫可以水平擴展,所以更多的讀請求不成問題。

但是當用戶量級上來後,寫請求越來越多,該怎麼辦?加一個Master是不能解決問題的, 因為數據要保存一致性,寫操作需要2個master之間同步,相當於是重覆了,而且更加複雜。

這時就需要用到分庫分表(sharding),對寫操作進行切分。

分庫分表前的問題

任何問題都是太大或者太小的問題,我們這裡面對的數據量太大的問題。

用戶請求量太大

因為單伺服器TPS,記憶體,IO都是有限的。 解決方法:分散請求到多個伺服器上; 其實用戶請求和執行一個sql查詢是本質是一樣的,都是請求一個資源,只是用戶請求還會經過網關,路由,http伺服器等。

單庫太大

單個資料庫處理能力有限;單庫所在伺服器上磁碟空間不足;單庫上操作的IO瓶頸 解決方法:切分成更多更小的庫

單表太大

CRUD都成問題;索引膨脹,查詢超時 解決方法:切分成多個數據集更小的表。

分庫分表的方式方法

一般就是垂直切分和水平切分,這是一種結果集描述的切分方式,是物理空間上的切分。 我們從面臨的問題,開始解決,闡述: 首先是用戶請求量太大,我們就堆機器搞定(這不是本文重點)。

然後是單個庫太大,這時我們要看是因為表多而導致數據多,還是因為單張表裡面的數據多。 如果是因為表多而數據多,使用垂直切分,根據業務切分成不同的庫。

如果是因為單張表的數據量太大,這時要用水平切分,即把表的數據按某種規則切分成多張表,甚至多個庫上的多張表。 分庫分表的順序應該是先垂直分,後水平分。 因為垂直分更簡單,更符合我們處理現實世界問題的方式。

垂直拆分

垂直分表

也就是“大表拆小表”,基於列欄位進行的。一般是表中的欄位較多,將不常用的, 數據較大,長度較長(比如text類型欄位)的拆分到“擴展表“。 一般是針對那種幾百列的大表,也避免查詢時,數據量太大造成的“跨頁”問題。

垂直分庫

垂直分庫針對的是一個系統中的不同業務進行拆分,比如用戶User一個庫,商品Producet一個庫,訂單Order一個庫。 切分後,要放在多個伺服器上,而不是一個伺服器上。為什麼?

我們想象一下,一個購物網站對外提供服務,會有用戶,商品,訂單等的CRUD。沒拆分之前, 全部都是落到單一的庫上的,這會讓資料庫的單庫處理能力成為瓶頸。按垂直分庫後,如果還是放在一個資料庫伺服器上, 隨著用戶量增大,這會讓單個資料庫的處理能力成為瓶頸,還有單個伺服器的磁碟空間,記憶體,tps等非常吃緊。 所以我們要拆分到多個伺服器上,這樣上面的問題都解決了,以後也不會面對單機資源問題。

資料庫業務層面的拆分,和服務的“治理”,“降級”機制類似,也能對不同業務的數據分別的進行管理,維護,監控,擴展等。 資料庫往往最容易成為應用系統的瓶頸,而資料庫本身屬於“有狀態”的,相對於Web和應用伺服器來講,是比較難實現“橫向擴展”的。 資料庫的連接資源比較寶貴且單機處理能力也有限,在高併發場景下,垂直分庫一定程度上能夠突破IO、連接數及單機硬體資源的瓶頸。

水平拆分

水平分表

針對數據量巨大的單張表(比如訂單表),按照某種規則(RANGE,HASH取模等),切分到多張表裡面去。 但是這些表還是在同一個庫中,所以庫級別的資料庫操作還是有IO瓶頸。不建議採用。

水平分庫分表

將單張表的數據切分到多個伺服器上去,每個伺服器具有相應的庫與表,只是表中數據集合不同。 水平分庫分表能夠有效的緩解單機和單庫的性能瓶頸和壓力,突破IO、連接數、硬體資源等的瓶頸。

水平分庫分表切分規則

  1. RANGE

    從0到10000一個表,10001到20000一個表;

  2. HASH取模

    一個商場系統,一般都是將用戶,訂單作為主表,然後將和它們相關的作為附表,這樣不會造成跨庫事務之類的問題。 取用戶id,然後hash取模,分配到不同的資料庫上。

  3. 地理區域

    比如按照華東,華南,華北這樣來區分業務,七牛雲應該就是如此。

  4. 時間

    按照時間切分,就是將6個月前,甚至一年前的數據切出去放到另外的一張表,因為隨著時間流逝,這些表的數據 被查詢的概率變小,所以沒必要和“熱數據”放在一起,這個也是“冷熱數據分離”。

分庫分表後面臨的問題

事務支持

分庫分表後,就成了分散式事務了。如果依賴資料庫本身的分散式事務管理功能去執行事務,將付出高昂的性能代價; 如果由應用程式去協助控制,形成程式邏輯上的事務,又會造成編程方面的負擔。

多庫結果集合併(group by,order by)

跨庫join

分庫分表後表之間的關聯操作將受到限制,我們無法join位於不同分庫的表,也無法join分表粒度不同的表, 結果原本一次查詢能夠完成的業務,可能需要多次查詢才能完成。

粗略的解決方法: 全局表:基礎數據,所有庫都拷貝一份。

欄位冗餘:這樣有些欄位就不用join去查詢了。

系統層組裝:分別查詢出所有,然後組裝起來,較複雜。

分庫分表方案產品

目前市面上的分庫分表中間件相對較多,其中基於代理方式的有MySQL Proxy和Amoeba, 基於Hibernate框架的是Hibernate Shards,基於jdbc的有噹噹sharding-jdbc, 基於mybatis的類似maven插件式的有蘑菇街的蘑菇街TSharding, 通過重寫spring的ibatis template類的Cobar Client。

還有一些大公司的開源產品。

更多文章推薦:

1.Spring Boot 3.x 教程,太全了!

2.2,000+ 道 Java面試題及答案整理(2024最新版)

3.免費獲取 IDEA 激活碼的 7 種方式(2024最新版)

覺得不錯,別忘了隨手點贊+轉發哦!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前言 大家在開發過程中,或多或少都會用到輪播圖之類的組件,PC和Mobile上使用 Swiper.js ,小程式上使用swiper組件等。 本文將詳細講解如何用Vue一步步實現的類似Swiper.js的功能,無任何第三方依賴,乾貨滿滿。 最終效果 線上預覽:https://zyronon.githu ...
  • 本篇作為《Vue+OpenLayers6入門教程》和《Vue+OpenLayers6實戰進階案例》所有文章的二合一彙總目錄,方便查找。 本專欄源碼是由OpenLayers6.15.1版本結合Vue2框架編寫,同時支持Vue3,零星幾篇文章用到了Element-UI庫。 本專欄從Vue搭建腳手架到如何 ...
  • 一、題目及運行環境 1.小組成員 2252331 與 2252336 2.題目 小學老師要每周給同學出300道四則運算練習題。 這個程式有很多種實現方式: C/C++ C#/VB.net/Java Excel Unix Shell Emacs/Powershell/Vbscript Perl Pyt ...
  • 重載(Overloading):所謂重載是指不同的函數實體共用一個函數名稱。例如以下代碼所提到的CPoint之中,有兩個member functions的名稱同為x(): 1 class CPoint{ 2 3 public: 4 float x(); 5 void x(float xval); 6 ...
  • 實驗要求一:對比分析 對比分析墨刀、Axure、Mockplus等原型設計工具的各自的適用領域及優缺點。 一丶墨刀 墨刀是一款線上的產品設計協作軟體,可以解決產設研團隊中存在的項目管理許可權不明、版本管理混亂、協作低效等諸多問題。 優點: 功能強大:可滿足產品經理、設計師、開發在產品設計和團隊協作上的 ...
  • title: 文本語音互相轉換系統設計 date: 2024/4/24 21:26:15 updated: 2024/4/24 21:26:15 tags: 需求分析 模塊化設計 性能優化 系統安全 智能化 跨平臺 區塊鏈 第一部分:導論 第一章:背景與意義 文本語音互相轉換系統的定義與作用 文本語 ...
  • 參考:https://www.cnblogs.com/mc-74120/p/13622008.html pom文件 <dependency> <groupId>io.netty</groupId> <artifactId>netty-all</artifactId> </dependency> 啟動 ...
  • 新手下載python和anaconda3要註意哪些 1、python 關於python下載其實很簡單,直接在官網下載就行。 官網:Welcome to Python.org 當然,到了官網下載是預設最新版本,如果你需要舊版本,那就需要找一下了,這裡提供一下windows的各版本的官網鏈接: Pyth ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...