不知道如何分庫分表,看完這篇文章,輕鬆應對工作面試

来源:https://www.cnblogs.com/yidengjiagou/archive/2022/06/18/16388553.html
-Advertisement-
Play Games

一個挺著啤酒肚,身穿格子衫,髮際線嚴重後移的中年男子,手拿著保溫杯,胳膊夾著MacBook向你走來,看樣子是架構師級別。 面試開始,直入正題。 面試官: 小伙子,看到你的簡歷上面寫了項目中有對MySQL進行分庫分表,為什麼要進行分庫分表? 我: 不知道啊!誰知道老大咋想的,反正我來的時候就已經分好了 ...


一個挺著啤酒肚,身穿格子衫,髮際線嚴重後移的中年男子,手拿著保溫杯,胳膊夾著MacBook向你走來,看樣子是架構師級別。

面試開始,直入正題。

面試官: 小伙子,看到你的簡歷上面寫了項目中有對MySQL進行分庫分表,為什麼要進行分庫分表?

我: 不知道啊!誰知道老大咋想的,反正我來的時候就已經分好了。

面試官: 嗯...,今天的面試就先到這吧,有後續面試會通知你,我送你下去。

別啊,每次都說會通知我,然後我就傻傻的回去等通知了。我是實話實說,難道讓我去訂閱一燈的文章,背誦八股文給你聽?
好吧!自古真情留不住,總是套路得人心。重來一次,我把一燈總結的八股文背誦一遍。

我: 當MySQL單表數據量過大,比如超過5千萬條的時候,讀寫性能變得很差。而且常規的優化手段已經不起作用了,比如:SQL調優、添加索引、主從複製、讀寫分離。這時候就需要用到MySQL終極優化方案 — 分庫分表。

面試官: 不錯,我該怎麼判斷項目是需要分庫還是要分表?是先分庫還是先分表?

這誰能現場總結出來?彆著急,等我看一眼一燈的八股文。

我: 有了。

  1. 當資料庫的QPS過高,資料庫連接數不足的時候,就需要分庫。
  2. 當單表數據量過大,讀寫性能較差,就需要分表。
  3. 當兩者都有的時候,就需要分庫分表。

至於先分庫還是先分表?建議先分表,如果分表能解決問題,就不需要分庫了,畢竟需要單獨伺服器資源,成本更高。

面試官: 小伙子,總結的挺全。分庫分表有哪些拆分方案呢?

我: 分庫分表有垂直拆分和水平拆分。垂直拆分又有垂直分庫、垂直分表。

垂直分庫,不同的業務拆分到不同的資料庫。

垂直分表,把長度較大或者訪問頻次較低的欄位,拆分到擴展表中。

水平分表,單表數據量過大時,按照訂單ID拆分到多張表中。

面試官: 小伙子,有點東西。都知道分庫分表好使,就沒有什麼缺點嗎?

我: 當然有,“所有命運饋贈的禮物,早已在暗中標好了價格。”分庫分錶帶來了低耦合、高性能的優點,可是缺點卻是一大堆。

垂直分庫:
不同庫多表之間無法join關聯查詢,只能通過介面聚合,複雜度直線上升。
橫跨多個資料庫導致無法使用本地事務,數據強一致性就別想了,只能引入更為複雜的分散式事務,勉強實現數據的最終一致性,可用性直線下降。

垂直分表:
本來一張表能查出來的數據,現在需要多張表join關聯查詢,這不瞎耽誤事。

水平分表:
多張表關聯查詢時,無法實現分頁、排序功能。

面試官: 分庫分錶帶來這麼多問題,你沒有沒考慮過相應的解決方案?

我怎麼可能沒有解決方案,難道我提出問題給自己挖坑?

我: 當然有考慮過,“有問題就會有答案”。

跨庫查詢問題:
採用欄位冗餘方案,比如訂單表存儲店鋪ID、店鋪名稱,就不需要再查詢商戶資料庫了。
不過這種方案要求冗餘欄位要很少變動,就算變動後,也能容忍返回舊數據。

多表分頁查詢問題:
這個處理起來就很需要技術含量了。
比如:訂單表按照訂單ID分片,(order_id % 128),分成了128張表。
Leader看了說:每張表的數據量差不多,分的很均勻,以後不要再分了。

同一個用戶的訂單散落在不同的表,用戶想查詢自己的訂單,根本無法做到分頁查詢。難道一次全部查詢該用戶的所有訂單,然後做記憶體分頁,多大的機器記憶體都讓你搞掛。
想要實現用戶訂單分頁查詢,可以採用按照用戶ID分片,(user_id % 128),這樣同一個用戶的訂單隻會存儲在一張表中,咋分頁展示都行。

沒有完美的分片方案,如果商戶想要分頁查看自己店鋪的訂單怎麼辦?
那就把訂單再冗餘存儲一份,按照店鋪ID分片,(shop_id % 128)。不過由於商戶數量較少,可以搞個非同步線程往商戶訂單分片表同步。

訂單按照用戶ID分片後,發生數據傾斜怎麼辦?
因為不同用戶的訂單量是不同的,一個愛好購物的小姐姐的訂單量抵得上幾十個老爺們。導致一張表數據幾百條,另一張表數據量千萬級,這該咋整?
做冷熱數據分離,基礎庫只存儲3個月內的訂單,其他的移動到歷史訂單庫。這個要跟產品商量好,3個月前的訂單需要單獨的查詢頁面。

跨庫事務問題:
這個問題就更複雜了。

下一個訂單需要調用多個服務,只能使用分散式事務。
分散式事務的實現非常複雜,常用的有以下幾種解決方案:
二階段提交
TCC
本地消息表
MQ事務消息
分散式事務中間件

面試官: 準備的挺全啊。訂單表分片後,肯定不能使用資料庫自增主鍵做訂單ID,因為無法全局唯一,有什麼好的解決辦法?

我: 又問到我手心裡面,我前兩天剛看完一燈寫的“雪花演算法”,我現場手寫訂單ID的生成代碼吧。

面試官: 小伙子可以啊,下一面是HR面試,有薪資要求儘管提,你一定要來我們公司上班。

總結:

關於分庫分表的所有知識點,雖然很多,但都已經總結在這張圖上了。

文章持續更新,可以微信搜一搜「 一燈架構 」第一時間閱讀更多技術乾貨。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 原文鏈接:http://www.zhoubotong.site/post/50.html defer語句用於延遲函數調用,每次會把一個函數壓入棧中,函數返回前再把延遲的函數取出並執行。延遲函數可以有參數: 延遲函數的參數在defer語句出現時就已確定下來(傳值的就是當前值) return先賦值(對於 ...
  • 這篇文章旨在介紹一個雙人的五子棋程式。再次重申,本人不擅長對代碼的可讀性進行優化,所以可能有些雜亂(在所難免)。 先瞅一眼效果圖: 請註意,這個棋子……是這麼圓潤立體!本程式不需任何素材圖片,完全用代碼繪製所需的圖像,因此這樣立體的棋子十分難能可貴。那麼,這究竟是如何做到的呢?別急,聽我慢慢道來。 ...
  • 學生試卷中的題目有要提交截圖的,也有要提交文件的,為了方便學生考試,允許單獨交或者嵌入Word中提交,那麼事後如何整理學生的答案?單獨提交的比較方便,直接掃描文件名匹配名字後放入指定文件夾即可。但是嵌入到Word中的圖片和文件怎麼提取出來呢? 現有如下需求:提取出一個Word文檔中所有的圖片(png ...
  • 閱讀前註意 本文所有代碼貼出來的目的是幫助大家理解,並非是要引導大家跟寫,許多環境問題文件問題沒有詳細說明,代碼也並不全面,達不到跟做的效果。建議直接閱讀全文即可,我在最後會給出詳細代碼地址,對源代碼細節更感興趣的同學可以下載參考。 性能測試:使用日誌 在c++中進行性能測試是令人頭疼的問題,我們往 ...
  • 很久沒有寫博客了, 感覺沒有學到讓我自己眼前一亮的東西,所以還在摸索當中; 不過最近在複習spring相關的內容, 特別是迴圈依賴這塊, 查詢了很多的資料, 比較有收穫, 就分享一下吧! 分為上下兩篇博客, 第一篇是複習一下spring的整體流程, 第二篇說一下迴圈依賴 提前須知: 最好自己看過sp ...
  • 學習背景 公司同事讓我提供一個簡單的 rpc 介面,然後他坐在我旁邊看著我寫,寫的過程中他不斷打斷我,比如我在代碼換行時,如果游標不在下一行行首或者這行的行尾,我就會先移動游標到行尾,再點擊回車進行換行,他這時候就會說,為什麼你不用快捷鍵直接換行,最後變成了他手把手教我如何更高效的用快捷鍵編程,之前 ...
  • 首先一些Python字元串處理的簡易常用的用法。其他的以後用到再補充。 1.去掉重覆空格 s = "hello hello hello" s = ' '.join(s.split()) 2.去掉所有回車(或其他字元或字元串) s = "hello\nhello\nhello hello\n" pri ...
  • 前言 經常聽到有朋友說,學習編程是一件非常枯燥無味的事情。其實,大家有沒有認真想過,可能是我們的學習方法不對? 比方說,你有沒有想過,可以通過打游戲來學編程?今天我想跟大家分享幾個Python小游戲,教你如何通過邊打游戲邊學編程! 1、吃金幣 沒有人沒玩過吃金幣吧,但是用python來寫一個吃金幣小 ...
一周排行
    -Advertisement-
    Play Games
  • 1、預覽地址:http://139.155.137.144:9012 2、qq群:801913255 一、前言 隨著網路的發展,企業對於信息系統數據的保密工作愈發重視,不同身份、角色對於數據的訪問許可權都應該大相徑庭。 列如 1、不同登錄人員對一個數據列表的可見度是不一樣的,如數據列、數據行、數據按鈕 ...
  • 前言 上一篇文章寫瞭如何使用RabbitMQ做個簡單的發送郵件項目,然後評論也是比較多,也是準備去學習一下如何確保RabbitMQ的消息可靠性,但是由於時間原因,先來說說設計模式中的簡單工廠模式吧! 在瞭解簡單工廠模式之前,我們要知道C#是一款面向對象的高級程式語言。它有3大特性,封裝、繼承、多態。 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 介紹 Nodify是一個WPF基於節點的編輯器控制項,其中包含一系列節點、連接和連接器組件,旨在簡化構建基於節點的工具的過程 ...
  • 創建一個webapi項目做測試使用。 創建新控制器,搭建一個基礎框架,包括獲取當天日期、wiki的請求地址等 創建一個Http請求幫助類以及方法,用於獲取指定URL的信息 使用http請求訪問指定url,先運行一下,看看返回的內容。內容如圖右邊所示,實際上是一個Json數據。我們主要解析 大事記 部 ...
  • 最近在不少自媒體上看到有關.NET與C#的資訊與評價,感覺大家對.NET與C#還是不太瞭解,尤其是對2016年6月發佈的跨平臺.NET Core 1.0,更是知之甚少。在考慮一番之後,還是決定寫點東西總結一下,也回顧一下.NET的發展歷史。 首先,你沒看錯,.NET是跨平臺的,可以在Windows、 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 添加節點(nodes) 通過上一篇我們已經創建好了編輯器實例現在我們為編輯器添加一個節點 添加model和viewmode ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...
  • 類型檢查和轉換:當你需要檢查對象是否為特定類型,並且希望在同一時間內將其轉換為那個類型時,模式匹配提供了一種更簡潔的方式來完成這一任務,避免了使用傳統的as和is操作符後還需要進行額外的null檢查。 複雜條件邏輯:在處理複雜的條件邏輯時,特別是涉及到多個條件和類型的情況下,使用模式匹配可以使代碼更 ...
  • 在日常開發中,我們經常需要和文件打交道,特別是桌面開發,有時候就會需要載入大批量的文件,而且可能還會存在部分文件缺失的情況,那麼如何才能快速的判斷文件是否存在呢?如果處理不當的,且文件數量比較多的時候,可能會造成卡頓等情況,進而影響程式的使用體驗。今天就以一個簡單的小例子,簡述兩種不同的判斷文件是否... ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...