不知道如何分庫分表,看完這篇文章,輕鬆應對工作面試

来源:https://www.cnblogs.com/yidengjiagou/archive/2022/06/18/16388553.html
-Advertisement-
Play Games

一個挺著啤酒肚,身穿格子衫,髮際線嚴重後移的中年男子,手拿著保溫杯,胳膊夾著MacBook向你走來,看樣子是架構師級別。 面試開始,直入正題。 面試官: 小伙子,看到你的簡歷上面寫了項目中有對MySQL進行分庫分表,為什麼要進行分庫分表? 我: 不知道啊!誰知道老大咋想的,反正我來的時候就已經分好了 ...


一個挺著啤酒肚,身穿格子衫,髮際線嚴重後移的中年男子,手拿著保溫杯,胳膊夾著MacBook向你走來,看樣子是架構師級別。

面試開始,直入正題。

面試官: 小伙子,看到你的簡歷上面寫了項目中有對MySQL進行分庫分表,為什麼要進行分庫分表?

我: 不知道啊!誰知道老大咋想的,反正我來的時候就已經分好了。

面試官: 嗯...,今天的面試就先到這吧,有後續面試會通知你,我送你下去。

別啊,每次都說會通知我,然後我就傻傻的回去等通知了。我是實話實說,難道讓我去訂閱一燈的文章,背誦八股文給你聽?
好吧!自古真情留不住,總是套路得人心。重來一次,我把一燈總結的八股文背誦一遍。

我: 當MySQL單表數據量過大,比如超過5千萬條的時候,讀寫性能變得很差。而且常規的優化手段已經不起作用了,比如:SQL調優、添加索引、主從複製、讀寫分離。這時候就需要用到MySQL終極優化方案 — 分庫分表。

面試官: 不錯,我該怎麼判斷項目是需要分庫還是要分表?是先分庫還是先分表?

這誰能現場總結出來?彆著急,等我看一眼一燈的八股文。

我: 有了。

  1. 當資料庫的QPS過高,資料庫連接數不足的時候,就需要分庫。
  2. 當單表數據量過大,讀寫性能較差,就需要分表。
  3. 當兩者都有的時候,就需要分庫分表。

至於先分庫還是先分表?建議先分表,如果分表能解決問題,就不需要分庫了,畢竟需要單獨伺服器資源,成本更高。

面試官: 小伙子,總結的挺全。分庫分表有哪些拆分方案呢?

我: 分庫分表有垂直拆分和水平拆分。垂直拆分又有垂直分庫、垂直分表。

垂直分庫,不同的業務拆分到不同的資料庫。

垂直分表,把長度較大或者訪問頻次較低的欄位,拆分到擴展表中。

水平分表,單表數據量過大時,按照訂單ID拆分到多張表中。

面試官: 小伙子,有點東西。都知道分庫分表好使,就沒有什麼缺點嗎?

我: 當然有,“所有命運饋贈的禮物,早已在暗中標好了價格。”分庫分錶帶來了低耦合、高性能的優點,可是缺點卻是一大堆。

垂直分庫:
不同庫多表之間無法join關聯查詢,只能通過介面聚合,複雜度直線上升。
橫跨多個資料庫導致無法使用本地事務,數據強一致性就別想了,只能引入更為複雜的分散式事務,勉強實現數據的最終一致性,可用性直線下降。

垂直分表:
本來一張表能查出來的數據,現在需要多張表join關聯查詢,這不瞎耽誤事。

水平分表:
多張表關聯查詢時,無法實現分頁、排序功能。

面試官: 分庫分錶帶來這麼多問題,你沒有沒考慮過相應的解決方案?

我怎麼可能沒有解決方案,難道我提出問題給自己挖坑?

我: 當然有考慮過,“有問題就會有答案”。

跨庫查詢問題:
採用欄位冗餘方案,比如訂單表存儲店鋪ID、店鋪名稱,就不需要再查詢商戶資料庫了。
不過這種方案要求冗餘欄位要很少變動,就算變動後,也能容忍返回舊數據。

多表分頁查詢問題:
這個處理起來就很需要技術含量了。
比如:訂單表按照訂單ID分片,(order_id % 128),分成了128張表。
Leader看了說:每張表的數據量差不多,分的很均勻,以後不要再分了。

同一個用戶的訂單散落在不同的表,用戶想查詢自己的訂單,根本無法做到分頁查詢。難道一次全部查詢該用戶的所有訂單,然後做記憶體分頁,多大的機器記憶體都讓你搞掛。
想要實現用戶訂單分頁查詢,可以採用按照用戶ID分片,(user_id % 128),這樣同一個用戶的訂單隻會存儲在一張表中,咋分頁展示都行。

沒有完美的分片方案,如果商戶想要分頁查看自己店鋪的訂單怎麼辦?
那就把訂單再冗餘存儲一份,按照店鋪ID分片,(shop_id % 128)。不過由於商戶數量較少,可以搞個非同步線程往商戶訂單分片表同步。

訂單按照用戶ID分片後,發生數據傾斜怎麼辦?
因為不同用戶的訂單量是不同的,一個愛好購物的小姐姐的訂單量抵得上幾十個老爺們。導致一張表數據幾百條,另一張表數據量千萬級,這該咋整?
做冷熱數據分離,基礎庫只存儲3個月內的訂單,其他的移動到歷史訂單庫。這個要跟產品商量好,3個月前的訂單需要單獨的查詢頁面。

跨庫事務問題:
這個問題就更複雜了。

下一個訂單需要調用多個服務,只能使用分散式事務。
分散式事務的實現非常複雜,常用的有以下幾種解決方案:
二階段提交
TCC
本地消息表
MQ事務消息
分散式事務中間件

面試官: 準備的挺全啊。訂單表分片後,肯定不能使用資料庫自增主鍵做訂單ID,因為無法全局唯一,有什麼好的解決辦法?

我: 又問到我手心裡面,我前兩天剛看完一燈寫的“雪花演算法”,我現場手寫訂單ID的生成代碼吧。

面試官: 小伙子可以啊,下一面是HR面試,有薪資要求儘管提,你一定要來我們公司上班。

總結:

關於分庫分表的所有知識點,雖然很多,但都已經總結在這張圖上了。

文章持續更新,可以微信搜一搜「 一燈架構 」第一時間閱讀更多技術乾貨。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 原文鏈接:http://www.zhoubotong.site/post/50.html defer語句用於延遲函數調用,每次會把一個函數壓入棧中,函數返回前再把延遲的函數取出並執行。延遲函數可以有參數: 延遲函數的參數在defer語句出現時就已確定下來(傳值的就是當前值) return先賦值(對於 ...
  • 這篇文章旨在介紹一個雙人的五子棋程式。再次重申,本人不擅長對代碼的可讀性進行優化,所以可能有些雜亂(在所難免)。 先瞅一眼效果圖: 請註意,這個棋子……是這麼圓潤立體!本程式不需任何素材圖片,完全用代碼繪製所需的圖像,因此這樣立體的棋子十分難能可貴。那麼,這究竟是如何做到的呢?別急,聽我慢慢道來。 ...
  • 學生試卷中的題目有要提交截圖的,也有要提交文件的,為了方便學生考試,允許單獨交或者嵌入Word中提交,那麼事後如何整理學生的答案?單獨提交的比較方便,直接掃描文件名匹配名字後放入指定文件夾即可。但是嵌入到Word中的圖片和文件怎麼提取出來呢? 現有如下需求:提取出一個Word文檔中所有的圖片(png ...
  • 閱讀前註意 本文所有代碼貼出來的目的是幫助大家理解,並非是要引導大家跟寫,許多環境問題文件問題沒有詳細說明,代碼也並不全面,達不到跟做的效果。建議直接閱讀全文即可,我在最後會給出詳細代碼地址,對源代碼細節更感興趣的同學可以下載參考。 性能測試:使用日誌 在c++中進行性能測試是令人頭疼的問題,我們往 ...
  • 很久沒有寫博客了, 感覺沒有學到讓我自己眼前一亮的東西,所以還在摸索當中; 不過最近在複習spring相關的內容, 特別是迴圈依賴這塊, 查詢了很多的資料, 比較有收穫, 就分享一下吧! 分為上下兩篇博客, 第一篇是複習一下spring的整體流程, 第二篇說一下迴圈依賴 提前須知: 最好自己看過sp ...
  • 學習背景 公司同事讓我提供一個簡單的 rpc 介面,然後他坐在我旁邊看著我寫,寫的過程中他不斷打斷我,比如我在代碼換行時,如果游標不在下一行行首或者這行的行尾,我就會先移動游標到行尾,再點擊回車進行換行,他這時候就會說,為什麼你不用快捷鍵直接換行,最後變成了他手把手教我如何更高效的用快捷鍵編程,之前 ...
  • 首先一些Python字元串處理的簡易常用的用法。其他的以後用到再補充。 1.去掉重覆空格 s = "hello hello hello" s = ' '.join(s.split()) 2.去掉所有回車(或其他字元或字元串) s = "hello\nhello\nhello hello\n" pri ...
  • 前言 經常聽到有朋友說,學習編程是一件非常枯燥無味的事情。其實,大家有沒有認真想過,可能是我們的學習方法不對? 比方說,你有沒有想過,可以通過打游戲來學編程?今天我想跟大家分享幾個Python小游戲,教你如何通過邊打游戲邊學編程! 1、吃金幣 沒有人沒玩過吃金幣吧,但是用python來寫一個吃金幣小 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 插件化的需求主要源於對軟體架構靈活性的追求,特別是在開發大型、複雜或需要不斷更新的軟體系統時,插件化可以提高軟體系統的可擴展性、可定製性、隔離性、安全性、可維護性、模塊化、易於升級和更新以及支持第三方開發等方面的能力,從而滿足不斷變化的業務需求和技術挑戰。 一、插件化探索 在WPF中我們想要開 ...
  • 歡迎ReaLTaiizor是一個用戶友好的、以設計為中心的.NET WinForms項目控制項庫,包含廣泛的組件。您可以使用不同的主題選項對項目進行個性化設置,並自定義用戶控制項,以使您的應用程式更加專業。 項目地址:https://github.com/Taiizor/ReaLTaiizor 步驟1: ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • Channel 是乾什麼的 The System.Threading.Channels namespace provides a set of synchronization data structures for passing data between producers and consume ...
  • efcore如何優雅的實現按年分庫按月分表 介紹 本文ShardinfCore版本 本期主角: ShardingCore 一款ef-core下高性能、輕量級針對分表分庫讀寫分離的解決方案,具有零依賴、零學習成本、零業務代碼入侵適配 距離上次發文.net相關的已經有很久了,期間一直在從事java相關的 ...
  • 前言 Spacesniffer 是一個免費的文件掃描工具,通過使用樹狀圖可視化佈局,可以立即瞭解大文件夾的位置,幫助用戶處理找到這些文件夾 當前系統C盤空間 清理後系統C盤空間 下載 Spacesniffer 下載地址:https://spacesniffer.en.softonic.com/dow ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • 一、ReZero簡介 ReZero是一款.NET中間件 : 全網唯一開源界面操作就能生成API , 可以集成到任何.NET6+ API項目,無破壞性,也可讓非.NET用戶使用exe文件 免費開源:MIT最寬鬆協議 , 一直從事開源事業十年,一直堅持開源 1.1 純ReZero開發 適合.Net Co ...
  • 一:背景 1. 講故事 停了一個月沒有更新文章了,主要是忙於寫 C#內功修煉系列的PPT,現在基本上接近尾聲,可以回頭繼續更新這段時間分析dump的一些事故報告,有朋友微信上找到我,說他們的系統出現了大量的http超時,程式不響應處理了,讓我幫忙看下怎麼回事,dump也抓到了。 二:WinDbg分析 ...
  • 開始做項目管理了(本人3年java,來到這邊之後真沒想到...),天天開會溝通整理需求,他們講話的時候忙裡偷閑整理一下常用的方法,其實語言還是有共通性的,基本上看到方法名就大概能猜出來用法。出去打水的時候看到外面太陽好好,真想在外面坐著曬太陽,回來的時候好兄弟三年前送給我的鍵盤D鍵不靈了,在打"等待 ...