最開始的網站架構 最初業務量不大,訪問量小,此時的架構,應用程式、資料庫、文件都部署在一臺伺服器上,有些甚至僅僅是租用主機空間 1. 應用、數據、文件分離 將應用程式、資料庫、文件各自部署在獨立的伺服器上,並且根據伺服器的用途配置不同的硬體,達到最佳的性能效果。 2. 利用緩存改善網站性能 大部分網 ...
最開始的網站架構
最初業務量不大,訪問量小,此時的架構,應用程式、資料庫、文件都部署在一臺伺服器上,有些甚至僅僅是租用主機空間
1. 應用、數據、文件分離
將應用程式、資料庫、文件各自部署在獨立的伺服器上,並且根據伺服器的用途配置不同的硬體,達到最佳的性能效果。
2. 利用緩存改善網站性能
大部分網站訪問都遵循28原則,即80%的訪問請求,最終落在20%的數據上,所以我們可以對熱點數據進行緩存,減少熱點數據的訪問路徑,提高用戶體驗。緩存實現常見的方式是本地緩存、分散式緩存。當然還有CDN、反向代理。
2.1 本地緩存 本地緩存,顧名思義是將數據緩存在應用伺服器本地,可以存在記憶體中,也可以存在文件,組件。本地緩存的特點是速度快,但因為本地空間有限所以緩存數據量也有限。OSCache就是常用的本地緩存。
2.2 分散式緩存 分散式緩存的特點是,可以緩存海量的數據,並且擴展非常容易,在門戶類網站中常常被使用,速度按理沒有本地緩存快,常用的分散式緩存是Memcached、Redis。
2.3 反向代理 部署在網站的機房,當用戶請求達到時首先訪問反向代理伺服器,反向代理伺服器將緩存的數據返回給用戶,如果沒有緩存數據才會繼續訪問應用伺服器獲取,這樣做減少了獲取數據的成本。反向代理有Squid,Nginx。
2.4 CDN 假設我們的伺服器都部署在杭州的機房,對於浙江的用戶來說訪問是較快的,而對於北京的用戶訪問是較慢的,這是由於浙江和北京分別屬於電信和聯通的不同發達地區,北京用戶訪問需要通過互聯路由器經過較長的路徑才能訪問到杭州的伺服器,返迴路徑也一樣,所以數據傳輸時間比較長。對於這種情況,常常使用CDN解決,CDN將數據內容緩存到運營商的機房,用戶訪問時先從最近的運營商獲取數據,這樣大大減少了網路訪問的路徑。比較專業的CDN運營商有藍汛、網宿。
3. 使用集群+負載均衡改善應用伺服器性能
應用伺服器作為網站的入口,會承擔大量的請求,我們往往通過應用伺服器集群來分擔請求數。 應用伺服器前面部署負載均衡伺服器調度用戶請求,根據分發策略將請求分發到多個應用伺服器節點。
常用的負載均衡技術硬體的有F5,價格比較貴一般都在15W以上。 軟體的有LVS、Nginx、HAProxy。LVS是四層(傳輸層)負載均衡,根據目標地址和埠選擇內部伺服器,Nginx和HAProxy是七層(應用層)負載均衡,可以根據報文內容選擇內部伺服器,因此LVS分發路徑優於Nginx 和HAProxy,性能要高些,而Nginx和HAProxy則更具配置性,如可以用來做動靜分離(根據請求報文特征,選擇靜態資源伺服器還是應用伺服器)。
4. 資料庫優化
4.1 讀寫分離和分庫分表 隨著用戶量的增加,資料庫成為最大的瓶頸,改善資料庫性能常用的手段是進行讀寫分離以及分庫分表,讀寫分離顧名思義就是將資料庫分為讀庫和寫庫,通過主備功能實現數據同步。分庫分表則分為水平切分和垂直切分,水平切分則是對一個資料庫特大的表進行拆分,例如用戶表。垂直切分則是根據業務的不同來切分,如用戶業務、商品業務相關的表放在不同的資料庫中。
4.2 使用NoSql資料庫和搜索引擎 對於海量數據的查詢和分析,我們使用nosql資料庫加上搜索引擎可以達到更好的性能。並不是所有的數據都要放在關係型數據中。常用的NOSQL有mongodb、hbase、redis,搜索引擎有lucene、solr、elasticsearch。
5. 將應用伺服器進行業務拆分
隨著業務的擴展,應用程式變得非常臃腫,這時我們需要將應用程式進行業務拆分,如百度分為新聞、網頁、圖片等業務。每個業務應用負責相對獨立的業務運作。業務之間通過消息進行通信或者共用資料庫來實現。
6.使用分散式系統
6.1 分散式文件系統 用戶一天天增加,業務量越來越大,產生的文件越來越多,單台的文件伺服器已經不能滿足需求,這時就需要分散式文件系統的支撐。常用的分散式文件系統有GFS、HDFS、TFS。
GFS(Google File System)可以給大量的用戶提供總體性能較高的服務
• 適合部署在廉價的普通硬體上
• 提供容錯功能
HDFS(Hadoop Distributed File System)能提供高吞吐量的數據訪問,非常適合大規模數據集上的應用
• 運行在通用硬體(commodityhardware)
• 高度容錯
• 適合部署在廉價的機器上
TFS(Taobao Flies System)主要針對海量的非結構化數據,提供高可靠和高併發的存儲訪問
• 高可擴展、高可用、高性能
• 面向互聯網服務
• 適合海量小文件存儲
6.2 分散式服務 各個業務應用都會使用到一些基本的業務服務,例如用戶服務、訂單服務、支付服務、安全服務,這些服務是支撐各業務應用的基本要素。我們將這些服務抽取出來利用分部式服務框架搭建分散式服務。阿裡的Dubbo是一個不錯的選擇。
小結
完整的系統架構圖如下:
註:大型網站的架構是根據業務需求不斷完善的,根據不同的業務特征會做特定的設計和考慮,本文只是講述一個常規大型網站會涉及的一些優化技術和手段。