大型網站架構系列:電商網站架構案例

来源:http://www.cnblogs.com/sannongy/archive/2017/02/23/6435658.html
-Advertisement-
Play Games

大型網站架構是一個系列文檔,歡迎大家關註。本次分享主題:電商網站架構案例。從電商網站的需求,到單機架構,逐步演變為常用的,可供參考的分散式架構的原型。除具備功能需求外,還具備一定的高性能,高可用,可伸縮,可擴展等非功能質量需求(架構目標)。 根據實際需要,進行改造,擴展,支持千萬PV,是沒問題的。 ...


大型網站架構是一個系列文檔,歡迎大家關註。本次分享主題:電商網站架構案例。從電商網站的需求,到單機架構,逐步演變為常用的,可供參考的分散式架構的原型。除具備功能需求外,還具備一定的高性能,高可用,可伸縮,可擴展等非功能質量需求(架構目標)。

根據實際需要,進行改造,擴展,支持千萬PV,是沒問題的。

本次分享大綱

  1. 電商案例的原因
  2. 電商網站需求
  3. 網站初級架構
  4. 系統容量估算
  5. 網站架構分析
  6. 網站架構優化
  7. 架構總結

電商網站案例,一共有三篇本篇主要說明網站的需求,網站初始架構,系統容量估算方法。

一、電商案例的原因

分散式大型網站,目前看主要有幾類1.大型門戶,比如網易,新浪等;2.SNS網站,比如校內,開心網等;3.電商網站:比如阿裡巴巴,京東商城,國美線上,汽車之家等。大型門戶一般是新聞類信息,可以使用CDN,靜態化等方式優化,開心網等交互性比較多,可能會引入更多的NOSQL,分散式緩存,使用高性能的通信框架等。電商網站具備以上兩類的特點,比如產品詳情可以採用CDN,靜態化,交互性高的需要採用NOSQL等技術。因此,我們採用電商網站作為案例,進行分析。

二、電商網站需求

客戶需求:

  • 建立一個全品類的電子商務網站(B2C),用戶可以線上購買商品,可以線上支付,也可以貨到付款;
  • 用戶購買時可以線上與客服溝通;
  • 用戶收到商品後,可以給商品打分,評價;
  • 目前有成熟的進銷存系統;需要與網站對接;
  • 希望能夠支持3~5年,業務的發展;
  • 預計3~5年用戶數達到1000萬;
  • 定期舉辦雙11,雙12,三八男人節等活動;
  • 其他的功能參考京東或國美線上等網站。

客戶就是客戶,不會告訴你具體要什麼,只會告訴你他想要什麼,我們很多時候要引導,挖掘客戶的需求。好在提供了明確的參考網站。因此,下一步要進行大量的分析,結合行業,以及參考網站,給客戶提供方案。

其他的略~~~~~

需求功能矩陣

需求管理傳統的做法,會使用用例圖或模塊圖(需求列表)進行需求的描述。這樣做常常忽視掉一個很重要的需求(非功能需求),因此推薦大家使用需求功能矩陣,進行需求描述。

本電商網站的需求矩陣如下:

 

網站需求 功能需求 非功能需求
全品類的電子商務網站 分類管理,商品管理 方便進行多品類管理(靈活性)網站訪問速度要快(高性能)圖片存儲的要求(海量小圖片)
用戶可以線上購買商品 會員管理,購物車,結算功能 良好購物體驗(可用性,性能)
線上支付或貨到付款 多種線上支付方式 支付過程要安全,數據加密(安全性)多種支付介面靈活切換(靈活性,擴展性)
可以線上與客服溝通 線上客服功能 可靠性:即時通訊
商品打分評價 商品評論  
目前有成熟的進銷存系統 對接進銷存 屬於約束條件對接時要考慮數據一致性,魯棒性
支持3~5年,業務的發展   屬於約束條件伸縮性,可擴展性
3~5年用戶數達到1000萬   約束條件
舉辦雙11,雙12,三八男人節等活動 活動管理,秒殺 突增訪問流量(可伸縮)實時性要求(高性能)
參考京東或國美線上   參考條件

以上是對電商網站需求的簡單舉例,目的是說明(1)需求分析的時候,要全面,大型分散式系統重點考慮非功能需求;(2)描述一個簡單的電商需求場景,使大家對下一步的分析設計有個依據。

三、網站初級架構

一般網站,剛開始的做法,是三台伺服器,一臺部署應用,一臺部署資料庫,一臺部署NFS文件系統。

這是前幾年比較傳統的做法,之前見到一個網站10萬多會員,垂直服裝設計門戶,N多圖片。使用了一臺伺服器部署了應用,資料庫以及圖片存儲。出現了很多性能問題。

如下圖:

但是,目前主流的網站架構已經發生了翻天覆地的變化。一般都會採用集群的方式,進行高可用設計。至少是下麵這個樣子。

(1)       使用集群對應用伺服器進行冗餘,實現高可用;(負載均衡設備可與應用一塊部署)

使用資料庫主備模式,實現數據備份和高可用;

四、系統容量預估

預估步驟:

  1. 註冊用戶數-日均UV量-每日的PV量-每天的併發量;
  2. 峰值預估:平常量的2~3倍;
  3. 根據併發量(併發,事務數),存儲容量計算系統容量。

客戶需求:3~5年用戶數達到1000萬註冊用戶;

每秒併發數預估:

  1. 每天的UV為200萬(二八原則);
  2. 每日每天點擊瀏覽30次;
  3. PV量:200*30=6000萬;
  4. 集中訪問量:24*0.2=4.8小時會有6000萬*0.8=4800萬(二八原則);
  5. 每分併發量:4.8*60=288分鐘,每分鐘訪問4800/288=16.7萬(約等於);
  6. 每秒併發量:16.7萬/60=2780(約等於);
  7. 假設:高峰期為平常值的三倍,則每秒的併發數可以達到8340次。
  8. 1毫秒=1.3次訪問;

沒好好學數學後悔了吧?!(不知道以上算是否有錯誤,呵呵~~)

伺服器預估:(以tomcat伺服器舉例)

  1. 按一臺web伺服器,支持每秒300個併發計算。平常需要10台伺服器(約等於);[tomcat預設配置是150]
  2. 高峰期:需要30台伺服器;

容量預估:70/90原則

系統CPU一般維持在70%左右的水平,高峰期達到90%的水平,是不浪費資源,並比較穩定的。記憶體,IO類似。

以上預估僅供參考,因為伺服器配置,業務邏輯複雜度等都有影響。在此CPU,硬碟,網路等不再進行評估。

五、網站架構分析

根據以上預估,有幾個問題:

  • 需要部署大量的伺服器,高峰期計算,可能要部署30台Web伺服器。並且這三十臺伺服器,只有秒殺,活動時才會用到,存在大量的浪費。
  • 所有的應用部署在同一臺伺服器,應用之間耦合嚴重。需要進行垂直切分和水平切分。
  • 大量應用存在冗餘代碼
  • 伺服器SESSION同步耗費大量記憶體和網路帶寬
  • 數據需要頻繁訪問資料庫,資料庫訪問壓力巨大。

大型網站一般需要做以下架構優化(優化是架構設計時,就要考慮的,一般從架構/代碼級別解決,調優主要是簡單參數的調整,比如JVM調優;如果調優涉及大量代碼改造,就不是調優了,屬於重構):

  • 業務拆分
  • 應用集群部署(分散式部署,集群部署和負載均衡)
  • 多級緩存
  • 單點登錄(分散式Session)
  • 資料庫集群(讀寫分離,分庫分表)
  • 服務化
  • 消息隊列
  • 其他技術

六、網站架構優化

6.1業務拆分

根據業務屬性進行垂直切分,劃分為產品子系統,購物子系統,支付子系統,評論子系統,客服子系統,介面子系統(對接如進銷存,簡訊等外部系統)。

根據業務子系統進行等級定義,可分為核心系統和非核心系統。核心系統:產品子系統,購物子系統,支付子系統;非核心:評論子系統,客服子系統,介面子系統。

業務拆分作用:提升為子系統可由專門的團隊和部門負責,專業的人做專業的事,解決模塊之間耦合以及擴展性問題;每個子系統單獨部署,避免集中部署導致一個應用掛了,全部應用不可用的問題。

等級定義作用:用於流量突發時,對關鍵應用進行保護,實現優雅降級;保護關鍵應用不受到影響。

拆分後的架構圖:

參考部署方案2

  1. 如上圖每個應用單獨部署
  2. 核心系統和非核心系統組合部署

6.2應用集群部署(分散式,集群,負載均衡)

分散式部署:將業務拆分後的應用單獨部署,應用直接通過RPC進行遠程通信;

集群部署:電商網站的高可用要求,每個應用至少部署兩台伺服器進行集群部署;

負載均衡:是高可用系統必須的,一般應用通過負載均衡實現高可用,分散式服務通過內置的負載均衡實現高可用,關係型資料庫通過主備方式實現高可用。

集群部署後架構圖:

6.3 多級緩存

緩存按照存放的位置一般可分為兩類本地緩存和分散式緩存。本案例採用二級緩存的方式,進行緩存的設計。一級緩存為本地緩存,二級緩存為分散式緩存。(還有頁面緩存,片段緩存等,那是更細粒度的劃分)

一級緩存,緩存數據字典,和常用熱點數據等基本不可變/有規則變化的信息,二級緩存緩存需要的所有緩存。當一級緩存過期或不可用時,訪問二級緩存的數據。如果二級緩存也沒有,則訪問資料庫。

緩存的比例,一般1:4,即可考慮使用緩存。(理論上是1:2即可)。

根據業務特性可使用以下緩存過期策略:

  1. 緩存自動過期;
  2. 緩存觸發過期;

6.4單點登錄(分散式Session)

系統分割為多個子系統,獨立部署後,不可避免的會遇到會話管理的問題。一般可採用Session同步,Cookies,分散式Session方式。電商網站一般採用分散式Session實現。

再進一步可以根據分散式Session,建立完善的單點登錄或賬戶管理系統。

流程說明

  1. 用戶第一次登錄時,將會話信息(用戶Id和用戶信息),比如以用戶Id為Key,寫入分散式Session;
  2. 用戶再次登錄時,獲取分散式Session,是否有會話信息,如果沒有則調到登錄頁;
  3. 一般採用Cache中間件實現,建議使用Redis,因此它有持久化功能,方便分散式Session宕機後,可以從持久化存儲中載入會話信息;
  4. 存入會話時,可以設置會話保持的時間,比如15分鐘,超過後自動超時;

結合Cache中間件,實現的分散式Session,可以很好的模擬Session會話。

6.5資料庫集群(讀寫分離,分庫分表)

大型網站需要存儲海量的數據,為達到海量數據存儲,高可用,高性能一般採用冗餘的方式進行系統設計。一般有兩種方式讀寫分離和分庫分表。

讀寫分離:一般解決讀比例遠大於寫比例的場景,可採用一主一備,一主多備或多主多備方式。

本案例在業務拆分的基礎上,結合分庫分表和讀寫分離。如下圖:

  1. 業務拆分後:每個子系統需要單獨的庫;
  2. 如果單獨的庫太大,可以根據業務特性,進行再次分庫,比如商品分類庫,產品庫;
  3. 分庫後,如果表中有數據量很大的,則進行分表,一般可以按照Id,時間等進行分表;(高級的用法是一致性Hash)
  4. 在分庫,分表的基礎上,進行讀寫分離;

相關中間件可參考Cobar(阿裡,目前已不在維護),TDDL(阿裡),Atlas(奇虎360),MyCat(在Cobar基礎上,國內很多牛人,號稱國內第一開源項目)。

分庫分表後序列的問題,JOIN,事務的問題,會在分庫分表主題分享中,介紹。

6.6服務化

將多個子系統公用的功能/模塊,進行抽取,作為公用服務使用。比如本案例的會員子系統就可以抽取為公用的服務。

6.7消息隊列

消息隊列可以解決子系統/模塊之間的耦合,實現非同步,高可用,高性能的系統。是分散式系統的標準配置。本案例中,消息隊列主要應用在購物,配送環節。

  1. 用戶下單後,寫入消息隊列,後直接返回客戶端;
  2. 庫存子系統:讀取消息隊列信息,完成減庫存;
  3. 配送子系統:讀取消息隊列信息,進行配送;

目前使用較多的MQ有Active MQ,Rabbit MQ,Zero MQ,MS MQ等,需要根據具體的業務場景進行選擇。建議可以研究下Rabbit MQ。

6.8其他架構(技術)

除了以上介紹的業務拆分,應用集群,多級緩存,單點登錄,資料庫集群,服務化,消息隊列外。還有CDN,反向代理,分散式文件系統,大數據處理等系統。

此處不詳細介紹,大家可以問度娘/Google,有機會的話也可以分享給大家。

七、架構總結

以上是本次分享的架構總結,其中細節可參考前面分享的內容。其中還有很多可以優化和細化的地方,因為是案例分享,主要針對重要部分做了介紹,工作中需要大家根據具體的業務場景進行架構設計。

轉自:http://www.51dev.com 開發者社區


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近做的一個項目中遇到了要用java發送郵件的需求, 在網上找了下資料, 並整理出來 第一步: 導包 1.使用maven 我這裡使用的是maven, IDE工具則是用的idea, 所以這裡給出配置文件pom.xml里Jar包資源 2.自己下載架包 如果沒用maven的話, 就網上找個找個javaMa ...
  • 題目描述:計算字元串最後一個單詞的長度,單詞以空格隔開。 輸入描述:一行字元串 輸出描述:整數N,最後一個單詞的長度。 輸入例子:hello world 輸出例子:5 ...
  • 轉自:http://blog.csdn.net/u010142437/article/details/22734857 一、類結構: 類型參數:E - 在此 collection 中保持的元素類型所有已實現的介面: Serializable, Iterable<E>, Collection<E>, ...
  • 我們在使用mybatis的時候,有時候,希望可以在eclipse的控制臺下列印出來sql語句,但是有時候卻不希望相關的語句列印。這個時候,需要我們進行一些配置。 在mybatis中,他通過調用一些介面,實現它的日誌功能。mybatis在輸出和列印日誌的時候,會按照先調用容器自帶的輸出日誌介面,如果沒 ...
  • 任何傻瓜都可以寫出電腦能懂的代碼,但好的程式員可以寫出人類能懂的代碼 Martin Fowler 如果你是新手,你可能會問,為什麼代碼需要設計原則? 我想說的是肯定不是為了故作高深,存在即是合理, 如果寫了一個簡單的程式,你可能不需要設計原則, 如果你寫了一個複雜的,但是之後再也不會改,那麼你也不 ...
  • 工廠模式(Factory) 依賴倒置原則(Dependency Inversion Principle):依賴抽象,不要依賴具體類。 要點 1. 簡單工廠 2. 工廠方法模式 ——定義了一個創建對象的介面,但由子類決定要實例化的類是哪一個。工廠方法讓類把實例化推遲到子類。 3. 抽象工廠模式 ——提 ...
  • 上一講說了rabbitmq在windows環境的部署,而今天主要說一下消息在產生後,如何去查看消息,事實上,rabbitmq為我們提供了功能強大的管理插件,我們只要開啟這個插件即可,它也是一個網站,埠是15672,走Http協議的,它每秒會從消息伺服器中拉取最新的消息,以便讓我們看到最新的queu ...
  • 想寫這篇文章很久了,今天終於有時間總結一下,一個大型的系統里,消息中間件是必不可少的,它將併發環境處理的數據非同步進行處理,有效的提高了系統的併發能力,有很多系統的瓶頸點都在於此,而消息中間件在這個時候就要登場了,它解決的問題也就是高併發的處理,將同步的阻塞變成非同步的處理! 我們工作中經常使用到的消息 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...