聊聊秒殺系統的設計(四)

来源:https://www.cnblogs.com/hhhnicvscs/archive/2022/09/20/16710774.html
-Advertisement-
Play Games

前言 如果你第一次接觸秒殺,可能還不太理解,庫存100件就賣100件,在資料庫里減到0就好了,這有什麼麻煩的?理論上是這樣,但是具體到業務場景中就沒那麼簡單了。今天就聊聊減庫存的設計,之後以高可用方案來結束秒殺設計的全部內容。 一、秒殺中的減庫存 減庫存操作一般有如下幾個方式: 1.下單減庫存:下單 ...


前言

如果你第一次接觸秒殺,可能還不太理解,庫存100件就賣100件,在資料庫里減到0就好了,這有什麼麻煩的?理論上是這樣,但是具體到業務場景中就沒那麼簡單了。今天就聊聊減庫存的設計,之後以高可用方案來結束秒殺設計的全部內容。


一、秒殺中的減庫存

減庫存操作一般有如下幾個方式:

1.下單減庫存:下單後,在商品的總庫存中減去購買數量,下單減庫存是最簡單的減庫存方式,也是控制最精確的一種,下單時直接通過資料庫的事務機制控制商品庫存,這樣一定不會出現超賣的情況。

2.付款減庫存:下單後,並不立即減庫存,而是等到付款後才真正減庫存,否則庫存一直保留給其他買家,但因為付款時才減庫存,如果併發比較高,有可能出現買家下單後付不了款的情況,可能商品已經被其他人買走了。

3.預扣庫存:下單後,庫存為其保留一定的時間, 超過這個時間,庫存將會自動釋放,釋放後其他買家就可以繼續購買,在買家付款前,系統會校驗該庫存是否還有保留,如果沒有保留,則再次嘗試預扣;如果庫存不足則不允許繼續付款;如果預扣成功,則完成付款並實際地減去庫存,這種方式相對複雜一些。

以上這幾種減庫存的方式都會存在一些問題。  假如我們採用“下單減庫存”的方式,正常情況下,買家下單後付款的概率會很高,所以不會有太大問題,但是有一種場景例外,就是當賣家參加某個活動時,此時活動的有效時間是商品的黃金售賣時間,通過惡意下單的方式將該賣家的商品全部下單,那麼這款商品就不能正常售賣了。要知道,這些惡意下單的人是不會真正付款的。

既然“下單減庫存”可能導致惡意下單,從而影響賣家的商品銷售,那麼有沒有辦法解決呢?你可能會想,採用“付款減庫存”的方式是不是就可以了?的確可以,但是 “付款減庫存”又會 導致另外一個問題:庫存超賣。假如有10件商品,因為下單時不會減庫存,就可能出現100人下單成功的情況,這樣一 來,就會導致很多買家下單成功但是付不了款,購物體驗自然比較差。

既然“下單減庫存”和“付款減庫存”都有缺點,我們能否採用“預扣庫存”這種方式呢? 這種方案確實可以在一定程度上緩解上面的問題,但是否就徹底解決了呢?針對惡意 下單這種情況,雖然把有效的付款時間設置為10分鐘,但是惡意買家完全可以在10分鐘後再次下單。

針對這種情況,解決辦法還是要結合反作弊的措施來制止, 例如,設置最大購買件數,對重覆下單不付款的操作進行次數限制等。針對“庫存超賣”這種情況,在10分鐘時間內下單的數量仍然有可能超過庫存數量,遇到這種情況只能區別對待:對普通的商品下單數量超過庫存數量的情況,可以通過補貨來解決;但是有些賣家完全不允許庫存為負數的情況,那隻能在買家付款時提示庫存不足。

由於參加秒殺的商品成功下單後卻不付款的情況比較少,再加上賣家對秒殺商品的庫存有嚴格限制,所以秒殺商品採用“下單減庫存”更加合理。一般我們有多種解決方案:一種是在應用程式中通過事務來判斷,即保證減後庫存不能為負數,否則就回滾;另一種辦法是直接設置資料庫的欄位數據為 無符號整數, 這樣減後庫存欄位值小於零時會直接執行SQL語句來報錯。 

二、秒殺中的高可用

高可用涉及架構階段、編碼階段、測試階段、運行階段。

1.架構階段:架構階段主要考慮系統的可擴展性和容錯性,要避免系統出現單點問題,例如多機房部署,即使某個機房出現整體故障,仍然不會影響整體網站的運轉。

2.編碼階段:編碼最重要的是保證代碼的健壯性,例如涉及遠程調用問題時,要設置合理的超時退出機制,防止被其他系統拖垮。

3.測試階段:測試主要是保證測試用例的覆蓋度,保證最壞情況發生時,我們也有相應的處理流 程。

4.運行階段:系統大部分時間都會處於運行態,運行態最重要的是對系統的監控要準確及時,發現問題能夠準確報警並且報警數據要準確詳細,以便於排查問題。

 為什麼系統的高可用建設要放到整個生命周期中全面考慮?因為我們在每個環節中都可能犯錯, 而有些環節犯的錯是無法彌補的。例如在架構階段,沒有消除單點問題,那麼系統 上線後,遇到突發流量把單點給掛了,加機器都加不進去。

那麼針對秒殺系統,我們重點介紹在遇到大流量時,應該從哪些方面來保障系統的穩定運行,所 以更多的是看如何針對運行階段進行處理,這就引出了接下來的內容:降級、限流

降級:就是當系統的容量達到一定程度時,限制或者關閉系統的某些非核心功能,從而把有限的資源保留給更核心的業務。降級方案可以這樣設計:當秒殺流量達到5w/s時,把成交記錄的獲取從展示20條降級到只展示5條。 

執行降級無疑是在系統性能和用戶體驗之間選擇了前者,降級後肯定會影響一部分用戶的體驗,。 所以降級的核心目標是犧牲次要的功能和用戶體驗來保證核心業務流程的穩定,是一個不得已而 為之的舉措。

限流: 如果說降級是犧牲了一部分次要的功能和用戶的體驗效果,那麼限流就是更極端的一種保護措施 了。限流就是當系統容量達到瓶頸時,我們需要通過限制一部分流量來保護系統,並做到既可以人工執行開關,也支持自動化保護的措施。

首先,來分別說下客戶端限流和服務端限流的優缺點。 客戶端限流,好處可以限制請求的發出,通過減少發出無用請求從而減少對系統的消耗,缺點 就是當客戶端比較分散時,沒法設置合理的限流閾值。如果閾值設的太小,會導致服務端沒有 達到瓶頸時客戶端已經被限制;而如果設的太大,則起不到限制的作用。 服務端限流,好處是可以根據服務端的性能設置合理的閾值,而缺點就是被限制的請求都是無效的請求,處理這些無效的請求本身也會消耗伺服器資源。

以上的內容就是我所介紹的秒殺系統設計中的難點和一些解決思路,不是每個方案都完美,選擇一個適合自己的才重要。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 現在的很多程式應用,基本上都是需要多端覆蓋,因此基於一個Web API的後端介面,來構建多端應用,如微信、H5、APP、WInForm、BS的Web管理端等都是常見的應用。本篇隨筆繼續分析總結一下項目開發的經驗,針對頁面組件化開發經驗方面進行一些梳理總結,內容包括組件的概念介紹,簡單頁面組件的抽取開... ...
  • 每日3題 1 以下代碼執行後,控制臺中的輸出內容為? // index.js console.log(1); import { sum } from "./sum.js"; console.log(sum(1, 2)); //sum.js console.log(2); export const s ...
  • 導讀:面對多種多樣的跨端訴求,有哪些跨端方案?跨端的本質是什麼?作為業務技術開發者,應該怎麼做?本文分享阿裡巴巴ICBU技術部在跨端開發上的一些思考,介紹了當前主流的跨端方案,以及跨端開發的經驗心得。 ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 最近在研究一個基於TP6的框架CRMEB,這裡分享下我的開發心得 首先在上篇文章中,我們安裝了CRMEBphp介面項目,需要可以看這一篇 TP6框架--CRMEB學習筆記:項目初始化+環境配置 1.獲取項目 這裡是git地址 https: ...
  • 通過 antd 框架的 Upload 控制項,採用手動上傳的方式,先選擇需要上傳的文件(控制文件數量以及大小),再根據所選的文件列表,迴圈上傳,期間通過 Spin 控制項提示上傳中。 ...
  • 隨著前端的範疇逐漸擴大,深度逐漸下沉,富前端必然帶來的一個問題就是性能。特別是在大型複雜項目中,重前端業務可能因為一個小小的數據依賴,導致整個頁面卡頓甚至崩潰。本文基於Quick BI(數據可視化分析平臺)歷年架構變遷中性能的排查、解決和總結出的“個性”問題,嘗試總結整個前端層面相對“共性”的問題,... ...
  • 最近,有群友問我,他們的一個作業,儘量使用少的標簽去實現這樣一個象棋佈局: 他用了 60 多個標簽,而他的同學,只用了 6 個,問我有沒有辦法儘可能的做到利用更少的標簽去完成這個佈局效果。 其實,對於一個頁面的佈局而言,標簽越少不一定是好事,我們在考慮 DOM 的消耗的同時,也需要關註代碼的可讀性, ...
  • ⚠️1.1萬長文⚠️ React源碼並非洪水猛獸,知道方法,就可以很輕易地馴服它(=^▽^=)。文章基於最新的React源碼進行調試及閱讀,將以通俗地方式解讀React ...
一周排行
    -Advertisement-
    Play Games
  • 在本篇教程中,我們學習瞭如何使用 Taurus.MVC WebMVC 框架創建一個簡單的頁面。 我們創建了一個控制器並編寫了一個用於呈現頁面的方法,然後創建了對應的視圖,並最終成功運行了應用程式。 在下一篇教程中,我們將繼續探索 Taurus.MVC WebMVC 框架的更多功能和用法。 ...
  • 一:背景 1. 講故事 很多.NET開發者在學習高級調試的時候,使用sos的命令輸出會發現這裡也看不懂那裡也看不懂,比如截圖中的這位朋友。 .NET高級調試屬於一個偏冷門的領域,國內可觀測的資料比較少,所以很多東西需要你自己去探究源代碼,然後用各種調試工具去驗證,相關源代碼如下: coreclr: ...
  • 我一直都以為c中除以2的n次方可以使用右移n位代替,然而在實際調試中發現並不都是這樣的。是在計算餘數是發現了異常 被除數:114325068 右移15計算結果:3488 除法取整計算結果:3489 右移操作計算餘數:33772 除法取整計算餘數:1005 顯然:這是不一樣的。 移位操作是一條cpu指 ...
  • 在上一篇文章中,我們介紹了ReentrantLock類的一些基本用法,今天我們重點來介紹一下ReentrantLock其它的常用方法,以便對ReentrantLock類的使用有更深入的理解。 ...
  • Excelize 是 Go 語言編寫的用於操作電子錶格辦公文檔的開源基礎庫,2024年2月26日,社區正式發佈了 2.8.1 版本,該版本包含了多項新增功能、錯誤修複和相容性提升優化。 ...
  • 雲採用框架(Cloud Adoption Framework,簡稱CAF)為企業上雲提供策略和技術的指導原則和最佳實踐,幫助企業上好雲、用好雲、管好雲,併成功實現業務目標。本雲採用框架是基於服務大量企業客戶的經驗總結,將企業雲採用分為四個階段,並詳細探討企業應在每個階段採取的業務和技術策略;同時,還 ...
  • 與TXT文本文件,PDF文件更加專業也更適合傳輸,常用於正式報告、簡歷、合同等場合。項目中如果有使用Java將TXT文本文件轉為PDF文件的需求,可以查看本文中介紹的免費實現方法。 免費Java PDF庫 本文介紹的方法需要用到Free Spire.PDF for Java,該免費庫支持多種操作、轉 ...
  • 指針和引用 當我們需要在程式中傳遞變數的地址時,可以使用指針或引用。它們都可以用來間接訪問變數,但它們之間有一些重要的區別。 指針是一個變數,它存儲另一個變數的地址。通過指針,我們可以訪問存儲在該地址中的變數。指針可以被重新分配,可以指向不同的變數,也可以為NULL。指針使用*運算符來訪問存儲在地址 ...
  • 即使再小再簡單的需求,作為研發開發完畢之後,我們可以直接上線麽?其實很多時候事故往往就是由於“不以為意”發生的。事故的發生往往也遵循“墨菲定律”,這就要求我們更要敬畏線上,再小的需求點都需要經過嚴格的測試驗證才能上線。 ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 一、是什麼 許可權是對特定資源的訪問許可,所謂許可權控制,也就是確保用戶只能訪問到被分配的資源 而前端許可權歸根結底是請求的發起權,請求的發起可能有下麵兩種形式觸發 頁面載入觸發 頁面上的按鈕點擊觸發 總的來說,所有的請求發起都觸發自前端路由或 ...