聊一聊分庫分表及它生產的一些概念

来源:https://www.cnblogs.com/buddy-yuan/archive/2019/12/23/12089178.html
-Advertisement-
Play Games

為什麼要分庫分表? 隨著近些年信息化大躍進,各行各業無紙化辦公產生了大量的數據,而越來越多的數據存入了資料庫中。當使用 資料庫的時候,單表超出了2000萬數據量就會出現性能上的分水嶺。並且物理伺服器的CPU、記憶體、存儲、連接數等資源有限,某個時段大量連接同時執行操作,會導致資料庫在處理上遇到性能瓶頸 ...


為什麼要分庫分表?

隨著近些年信息化大躍進,各行各業無紙化辦公產生了大量的數據,而越來越多的數據存入了資料庫中。當使用MySQL資料庫的時候,單表超出了2000萬數據量就會出現性能上的分水嶺。並且物理伺服器的CPU、記憶體、存儲、連接數等資源有限,某個時段大量連接同時執行操作,會導致資料庫在處理上遇到性能瓶頸。為瞭解決這個問題,行業先驅門充分發揚了分而治之的思想,對大表進行分割,然後實施更好的控制和管理,同時使用多台機器的CPU、記憶體、存儲,提供更好的性能。而分而治之則有兩種方式:垂直拆分水平拆分

垂直拆分

垂直拆分分為垂直分庫垂直分表。先說說垂直分庫。垂直分庫其實是一種簡單邏輯分割。比如我們的資料庫中有商品表Products、還有對訂單表Orders,還有積分表Scores。接下來我們就可以創建三個資料庫,一個資料庫存放商品,一個資料庫存放訂單,一個資料庫存放積分。如下圖所示:
垂直分庫

垂直分庫有一個優點,他能夠根據業務場景進行孵化,比如某一單一場景只用到某2-3張表,基本上應用和資料庫可以拆分出來做成相應的服務。

再來說說垂直分表,比較適用於那種欄位比較多的表,假設我們一張表有100個欄位,我們分析了一下當前業務執行的SQL語句,有20個欄位是經常使用的,而另外80個欄位使用比較少。這樣我們就可以把20個欄位放在主表裡面,我們在創建一個輔助表,存放另外80個欄位。當然主表和輔助表都是有主鍵的。他們通過主鍵進行關聯合併,就可以湊成100個欄位的表。
垂直分表

垂直分表可以解決跨頁的問題。在Oracle中叫行鏈接。怎麼理解呢?就是你欄位少的情況下,原本一行數據只需要存在一個頁裡面就行了,但是欄位多的情況就存不下了,就需要跨頁。這樣就會造成額外定址,造成性能上的開銷。另外將這麼長的一行數據載到記憶體中,往往是幾個頁面,結果咱們經常只訪問其中的幾個欄位,對記憶體也是一個極大的開銷。所以為了讓記憶體緩存更多數據,減少磁碟I/O,垂直分表就是很好的手段。

總體來說:垂直拆分有以下優點:

  • 跟隨業務進行分割,和最近流行的微服務概念相似,方便解耦之後的管理及擴展。
  • 高併發的場景下,垂直拆分使用多台伺服器的CPU、I/O、記憶體能提升性能,同時對單機資料庫連接數、一些資源限制也得到了提升。
  • 能實現冷熱數據的分離。

垂直拆分的缺點:

  • 部分業務表無法join,應用層需要很大的改造,只能通過聚合的方式來實現。增加了開發的難度。
  • 當單庫中的表數據量增大的時候依然沒有得到有效的解決。
  • 分散式事務也是一個難題。

水平拆分

當某張表數據量達到一定的程度的時候,前面曾說過MySQL單表出現2000萬以上數據就會出現性能上的分水嶺。此時發現沒有辦法根據業務規則再進行拆分了,就會導致單庫上的讀寫性能出現瓶頸。此時就只能進行水平拆分了。

水平拆分又分為庫內分表分庫分表。先說說庫內分表。假設當我們的Orders表達到了5000萬行記錄的時候,非常影響資料庫的讀寫效率,怎麼辦呢?我們可以考慮按照訂單編號的order_id進行rang分區,就是把訂單編號在1-1000萬的放在order1表中,將編號在1000萬-2000萬的放在order2中,以此類推,每個表中存放1000萬數據。如下圖所示:

庫內分表

雖然我們可以通過庫內分表把單表的容量固定在1000萬,但是這些表的數據仍然存放在一個庫內,使用的是該主機的CPU、IO、記憶體。單庫的連接數也有限制。並不能完全的降低系統的壓力。此時,我們就要考慮另外一種技術叫分庫分表。分庫分表在庫內分表的基礎上,將分的表挪動到不同的主機和資料庫上。可以充分的使用其他主機的CPU、記憶體和IO資源。並且分庫之後,單庫的連接數限制也不在成為瓶頸。但是“成也蕭何敗也蕭何”,如果你執行一個掃描不帶分片鍵,則需要在每個庫上查一遍。剛剛我們按照order_id分成了5個庫,但是我們查詢是name='AAA'的條件並且不帶order_id欄位時,它並不知道在哪個分片上查,則會創建5個連接,然後每個庫都檢索一遍。這種廣播查詢則會造成連接數增多。因為它需要在每個庫上都創立連接。如果是高併發的系統,執行這種廣播查詢,系統的thread很快就會告警。

分庫分表

總體來說:水平拆分的優點有以下:

  • 水平擴展能無線擴展。不存在某個庫某個表過大的情況。
  • 能夠較好的應對高併發,同時可以將熱點數據打散。
  • 應用側的改動較小,不需要根據業務來拆分。

水平拆分的缺點:

  • 路由是個問題,需要增加一層路由的計算,而且像前面說的一樣,不帶分片鍵查詢會產生廣播SQL。
  • 跨庫join的性能比較差。
  • 需要處理分散式事務的一致性問題。

一起使用

當前我們的系統,垂直拆分水平拆分都在使用,垂直拆分主要是做業務上的分割,把業務的各個子系統都規劃好,能解耦就解耦。而垂直拆分之後。我們再做水平分庫分表。通過取模演算法將大表數據拆到若幹個庫中。

邏輯庫和物理庫

介紹了上述的分庫分表,我們有必要說一下幾個概念,一個是邏輯庫物理庫的概念。我們還是拿水平拆分中的分庫分表來說。我們在物理層面,將一個庫的數據分割到了5個資料庫中。這5個資料庫就是物理庫,而它們對上層應用的展現則是一個庫。這個對上層展現的庫就叫邏輯庫。邏輯庫對應用層是透明的。應用不需要瞭解底層的情況,直接使用就行了。

邏輯表和物理表

還是拿水平拆分中的分庫分表來說,orders表總共被分成了5份,分別在底層是orders_1~5。這底層的5個表就是物理表。但是對應用層面來說,只有orders表。這就是邏輯表

總結:這一篇主要是講述一些分庫分表之後的概念。需要加深一些理解,因為我們的項目也才是剛剛開始拆分,所以有寫的不對的地方還希望小伙伴們提出意見指正。

參考文檔:


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 我們常用的linux系統在安裝過程中大多都省略了對系統進行分區的操作,以至於後期,不瞭解什麼是分區以及分區當中最基本的一些概念, 我們不說最細的知識,只求瞭解這個過程,那直接步入正題,開始第一節的學習。 開始準備 Linux 系統鏡像一個 這裡我選擇的是 TinyCore Linux 最小的linu ...
  • 作為各種電子產品的控制和處理核心,微控制單元(MCU)器件是一種集成微處理器(CPU)、存儲器(RAM/ROM)、計數器,以及I/O埠的晶元。從MCU內核架構來看,單片機有歷經多年的8051,基於Arm CortexM內核的微處理器,以及最近兩年流行起來的開源RISC-V微處理器。無論採用哪種架構 ...
  • SpringBoot+Shiro+mybatis整合 1. 使用Springboot版本2.0.4 與shiro的版本 引入springboot和shiro依賴 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.a ...
  • 文本處理都要使用正則表達式,正則表達式有: 基本正則表達式: 或者 擴展正則表達式: 或者 Linux 文本處理三劍客: sed:stream editor,流編輯工具程式。 awk:linux上是gawk,格式化文本工具程式。 grep:Global search Regular expressi ...
  • zabbix監控redis腳本 !/bin/bash 此腳本用來獲取redis cli info信息 redis_cli="/usr/local/redis/bin/redis cli" redis_host="127.0.0.1" redis_pass="123456" redis_port="6 ...
  • 執行apt-get install fcitx時,報如下錯誤 grub-pc E: Sub-process /usr/bin/dpkg returned an error code (1) 通過執行下麵的命令可以解決該問題: sudo mv /var/lib/dpkg/info/ /var/lib/ ...
  • 適用於 的 子系統 ( ) 是 新增的功能,使用它可以直接在 上運行 命令。而 是 的一個新版本,它支持適用於 的 子系統在 上運行 二進位文件。 它的主要目標是提高文件系統的性能,並增加系統調用的完全相容性。 使用最新和最高的虛擬化技術在輕型實用程式虛擬機( )內部運行 內核。 啟用並配置 WSL ...
  • mongodb 的 安裝配置,庫的備份恢復,基礎命令,聚合的用法和實例 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...