對於大型網站,分層和分隔的一個主要目的是為了切分後的模塊便於分散式部署,即將不同模塊部署在不同的伺服器上,通過遠程調用協同工作。分散式意味著可以使用更多的電腦完同樣的工作,電腦越多,CPU、記憶體、存儲資源就越多,能過處理的併發訪問和數據量就越大,進而能夠為更多的用戶提供服務。 ...
1、分層
分層是企業應用系統中最常見的一種架構模式,將系統在橫向維度上切分成幾個部分,每個部分負責一部分相對簡單並比較單一的職責,然後通過上層對下層的依賴和調度組成一個完整的系統。
在網站的分層架構中,常見的為3層,即應用層、服務層、數據層。應用層具體負責業務和視圖的展示;服務層為應用層提供服務支持;資料庫提供數據存儲訪問服務,如資料庫、緩存、文件、搜索引擎等。
分層架構是邏輯上的,在物理部署上,三層架構可以部署在同一個物理機器上,但是隨著網站業務的發展,必然需要對已經分層的模塊分離部署,即三層結構分別部署在不同的伺服器上,是網站擁有更多的計算資源以應對越來越多的用戶訪問。
所以雖然分層架構模式最初的目的是規劃軟體清晰的邏輯結構以便於開發維護,但在網站的發展過程中,分層結構對網站支持高併發向分散式方向的發展至關重要。
2、冗餘
網站需要7×24小時連續運行,那麼就得有相應的冗餘機制,以防某台機器宕掉時無法訪問,而冗餘則可以通過部署至少兩台伺服器構成一個集群實現服務高可用。資料庫除了定期備份還需要實現冷熱備份。甚至可以在全球範圍內部署災備數據中心。
3、分隔
如果說分層是將軟體在橫向方面進行切分,那麼分隔就是在縱向方面對軟體進行切分。
網站越大,功能越複雜,服務和數據處理的種類也越多,將這些不同的功能和服務分隔開來,包裝成高內聚低耦合的模塊單元,不僅有助於軟體的開發維護也便於不同模塊的分散式部署,提高網站的併發處理能力和功能擴展能力。
大型網站分隔的粒度可能會很小。比如在應用層,將不同業務進行分隔,例如將購物、論壇、搜索、廣告分隔成不同的應用,有對立的團隊負責,部署在不同的伺服器上。
4、非同步
使用非同步,業務之間的消息傳遞不是同步調用,而是將一個業務操作分成多個階段,每個階段之間通過共用數據的方法非同步執行進行協作。
具體實現則在單一伺服器內部可用通過多線程共用記憶體對了的方式處理;在分散式系統中可用通過分散式消息隊列來實現非同步。
非同步架構的典型就是生產者消費者方式,兩者不存在直接調用。
5、分散式
對於大型網站,分層和分隔的一個主要目的是為了切分後的模塊便於分散式部署,即將不同模塊部署在不同的伺服器上,通過遠程調用協同工作。分散式意味著可以使用更多的電腦完同樣的工作,電腦越多,CPU、記憶體、存儲資源就越多,能過處理的併發訪問和數據量就越大,進而能夠為更多的用戶提供服務。
在網站應用中,常用的分散式方案有一下幾種.
分散式應用和服務:將分層和分隔後的應用和服務模塊分散式部署,可以改善網站性能和併發性、加快開發和發佈速度、減少資料庫連接資源消耗。
分散式靜態資源:網站的靜態資源如JS、CSS、Logo圖片等資源對立分散式部署,並採用獨立的功能變數名稱,即人們常說的動靜分離。靜態資源分散式部署可以減輕應用伺服器的負載壓力;通過使用獨立功能變數名稱加快瀏覽器併發載入的速度。
分散式數據和存儲:大型網站需要處理以P為單位的海量數據,單台電腦無法提供如此大的存儲空間,這些資料庫需要分散式存儲。
分散式計算:目前網站普遍使用Hadoop和MapReduce分散式計算框架進行此類批處理計算,其特點是移動計算而不是移動數據,將計算程式分發到數據所在的位置以加速計算和分散式計算。
6、安全
網站在安全架構方面有許多模式:通過密碼和手機校驗碼進行身份認證;登錄、交易需要對網路通信進行加密;為了防止機器人程式濫用資源,需要使用驗證碼進行識別;對常見的XSS攻擊、SQL註入需要編碼轉換;垃圾信息需要過濾等。
7、自動化
具體有自動化發佈過程,自動化代碼管理、自動化測試、自動化安全檢測、自動化部署、自動化監控、自動化報警、自動化失效轉移、自動化失效恢復等。
8、集群
對於用戶訪問集中的模塊需要將獨立部署的伺服器集群化,即多台伺服器部署相同的應用構成一個集群,通過負載均衡設備共同對外提供服務。
伺服器集群能夠為相同的服務提供更多的併發支持,因此當有更多的用戶訪問時,只需要向集群中加入新的機器即可;另外可以實現當其中的某台伺服器發生故障時,可以通過負載均衡的失效轉移機制將請求轉移至集群中其他的伺服器上,因此可以提高系統的可用性。
9、緩存
緩存目的就是減輕伺服器的計算,使數據直接返回給用戶。在現在的軟體設計中,緩存已經無處不在。具體實現有CDN、反向代理、本地緩存、分散式緩存等。
使用緩存有兩個條件:訪問數據熱點不均衡,即某些頻繁訪問的數據需要放在緩存中;數據在某個時間段內有效,不過很快過期,否在會因為數據過期而臟讀,影響數據的正確性。