【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

来源:http://www.cnblogs.com/aiweixiao/archive/2017/01/06/6246914.html
-Advertisement-
Play Games

本文地址 分享提綱: 1. 概述 2. 知識點 1.概述 1)【書名及鏈接】 《大型網站技術架構 核心原理與案例分析》 2)【主要內容】 由李智慧著作的《大型網站技術架構(核心原理與案例分析)》通過梳理大型網站技術發展歷程,剖析大型網站技術架構模式,深入講述大型互聯網架構設計的核心原理,並通過一組典 ...


本文地址

分享提綱:

  1. 概述

  2. 知識點

 

 1.概述


  

  1)【書名及鏈接】

  《大型網站技術架構 核心原理與案例分析

http://img14.360buyimg.com/n0/jfs/t289/175/737305802/31197/d20604/54213ca6N7d10f6d7.jpg

 

   2)【主要內容】

    由李智慧著作的《大型網站技術架構(核心原理與案例分析)》通過梳理大型網站技術發展歷程,剖析大型網站技術架構模式,深入講述大型互聯網架構設計的核心原理,並通過一組典型網站技術架構設計案例,為讀者呈現一幅包括技術SHOU*選型、架構設計、性能優化、web安全、系統發佈、運維監控等在內的大型網站開發全景視圖。 
    大型網站技術架構(核心原理與案例分析)》不僅適用於指導網站工程師、架構師進行網站技術架構設計,也可用於指導產品經理、項目經理、測試運維人員等瞭解網站技術架構的基礎概念;還可供包括企業系統開發人員在內的各類軟體開發從業人員借鑒,瞭解大型網站的解決方案和開發理念。

 

  3)【目錄結構】  

第YI篇 概述 
1 大型網站架構演化 
1.1 大型網站軟體系統的特點 
1.2 大型網站架構演化發展歷程 
1.2.1 初始階段的網站架構 
1.2.2 應用服務和數據服務分離 
1.2.3 使用緩存改善網站性能 
1.2.4 使用應用伺服器集群改善網站的併發處理能力 
1.2.5 資料庫讀寫分離 
1.2.6 使用反向代理和CDN加速網站響應 
1.2.7 使用分散式文件系統和分散式資料庫系統 
1.2.8 使用NoSQL和搜索引擎 
1.2.9 業務拆分 
1.2.10 分散式服務 
1.3 大型網站架構演化的價值觀 
1.3.1 大型網站架構技術的核心價值是隨網站所需靈活應對 
1.3.2 驅動大型網站技術發展的主要力量是網站的業務發展 
1.4 網站架構設計誤區 
1.4.1 一味追隨大公司的解決方案 
1.4.2 為了技術而技術 
1.4.3 企圖用技術解決所有問題 
1.5 小結 
2 大型網站架構模式 
2.1 網站架構模式 
2.1.1 分層 
2.1.2 分割 
2.1.3 分散式 
2.1.4 集群 
2.1.5 緩存 
2.1.6 非同步 
2.1.7 冗餘 
2.1.8 自動化 
2.1.9 安全 
2.2 架構模式在新浪微博的應用 
2.3 小結 
3 大型網站核心架構要素 
3.1 性能 
3.2 可用性 
3.3 伸縮性 
3.4 擴展性 
3.5 安全性 
3.6 小結 
第2篇 架構 
4 瞬時響應:網站的高性能架構 
4.1 網站性能測試 
4.1.1 不同視角下的網站性能 
4.1.2 性能測試指標 
4.1.3 性能測試方法 
4.1.4 性能測試報告 
4.1.5 性能優化策略 
4.2 Web前端性能優化 
4.2.1 瀏覽器訪問優化 
4.2.2 CDN加速 
4.2.3 反向代理 
4.3 應用伺服器性能優化 
4.3.1 分散式緩存 
4.3.2 非同步操作 
4.3.3 使用集群 
4.3.4 代碼優化 
4.4 存儲性能優化 
4.4.1 機械硬碟vs. 固態硬碟 
4.4.2 B+樹vs. LSM樹 
4.4.3 RAID vs. HDFS 
4.5 小結 
5 萬無一失:網站的高可用架構 
5.1 網站可用性的度量與考核 
5.1.1 網站可用性度量 
5.1.2 網站可用性考核 
5.2 高可用的網站架構 
5.3 高可用的應用 
5.3.1 通過負載均衡進行無狀態服務的失效轉移 
5.3.2 應用伺服器集群的Session管理 
5.4 高可用的服務 
5.5 高可用的數據 
5.5.1 CAP原理 
5.5.2 數據備份 
5.5.3 失效轉移 
5.6 高可用網站的軟體質量保證 
5.6.1 網站發佈 
5.6.2 自動化測試 
5.6.3 預發佈驗證 
5.6.4 代碼控制 
5.6.5 自動化發佈 
5.6.6 灰度發佈 
5.7 網站運行監控 
5.7.1 監控數據採集 
5.7.2 監控管理 
5.8 小結 
6 永無止境:網站的伸縮性架構 
6.1 網站架構的伸縮性設計 
6.1.1 不同功能進行物理分離實現伸縮 
6.1.2 單一功能通過集群規模實現伸縮 
6.2 應用伺服器集群的伸縮性設計 
6.2.1 HTTP重定向負載均衡 
6.2.2 DNS功能變數名稱解析負載均衡 
6.2.3 反向代理負載均衡 
6.2.4 IP負載均衡 
6.2.5 數據鏈路層負載均衡 
6.2.6 負載均衡演算法 
6.3 分散式緩存集群的伸縮性設計 
6.3.1 Memcached分散式緩存集群的訪問模型 
6.3.2 Memcached分散式緩存集群的伸縮性挑戰 
6.3.3 分散式緩存的一致性Hash演算法 
6.4 數據存儲伺服器集群的伸縮性設計 
6.4.1 關係資料庫集群的伸縮性設計 
6.4.2 NoSQL資料庫的伸縮性設計 
6.5 小結 
7 隨需應變:網站的可擴展架構 
7.1 構建可擴展的網站架構 
7.2 利用分散式消息隊列降低系統耦合性 
7.2.1 事件驅動架構 
7.2.2 分散式消息隊列 
7.3 利用分散式服務打造可復用的業務平臺 
7.3.1 Web Service與企業級分散式服務 
7.3.2 大型網站分散式服務的需求與特點 
7.3.3 分散式服務框架設計 
7.4 可擴展的數據結構 
7.5 利用開放平臺建設網站生態圈 
7.6 小結 
8 固若金湯:網站的安全架構 
8.1 道高一尺魔高一丈的網站應用攻擊與防禦 
8.1.1 XSS攻擊 
8.1.2 註入攻擊 
8.1.3 CSRF攻擊 
8.1.4 其他攻擊和漏洞 
8.1.5 Web應用防火牆 
8.1.6 網站安全漏洞掃描 
8.2 信息加密技術及密鑰安全管理 
8.2.1 單向散列加密 
8.2.2 對稱加密 
8.2.3 非對稱加密 
8.2.4 密鑰安全管理 
8.3 信息過濾與反垃圾 
8.3.1 文本匹配 
8.3.2 分類演算法 
8.3.3 黑名單 
8.4 電子商務風險控制 
8.4.1 風險 
8.4.2 風控 
8.5 小結 
第3篇 案例 
9 淘寶網的架構演化案例分析 
9.1 淘寶網的業務發展歷程 
9.2 淘寶網技術架構演化 
9.3 小結 
10 維基百科的高性能架構設計分析 
10.1 Wikipedia網站整體架構 
10.2 Wikipedia性能優化策略 
10.2.1 Wikipedia前端性能優化 
10.2.2 Wikipedia服務端性能優化 
10.2.3 Wikipedia後端性能優化 
11 海量分散式存儲系統Doris的高可用架構設計分析 
11.1 分散式存儲系統的高可用架構 
11.2 不同故障情況下的高可用解決方案 
11.2.1 分散式存儲系統的故障分類 
11.2.2 正常情況下系統訪問結構 
11.2.3 瞬時故障的高可用解決方案 
11.2.4 臨時故障的高可用解決方案 
11.2.5 永JIU故障的高可用解決方案 
12 網購秒殺系統架構設計案例分析 
12.1 秒殺活動的技術挑戰 
12.2 秒殺系統的應對策略 
12.3 秒殺系統架構設計 
12.4 小結 
13 大型網站典型故障案例分析 
13.1 寫日誌也會引發故障 
13.2 高併發訪問資料庫引發的故障 
13.3 高併發情況下鎖引發的故障 
13.4 緩存引發的故障 
13.5 應用啟動不同步引發的故障 
13.6 大文件讀寫獨占磁碟引發的故障 
13.7 濫用生產環境引發的故障 
13.8 不規範的流程引發的故障 
13.9 不好的編程習慣引發的故障 
13.10 小結 
第4篇 架構師 
14 架構師領導藝術 
14.1 關註人而不是產品 
14.2 發掘人的YOU秀 
14.3 共用美好藍圖 
14.4 共同參與架構 
14.5 學會妥協 
14.6 成就他人 
15 網站架構師職場攻略 
15.1 發現問題,尋找突破 
15.2 提出問題,尋求支持 
15.3 解決問題,達成績效 
16 漫話網站架構師 
16.1 按作用劃分架構師 
16.2 按效果劃分架構師 
16.3 按職責角色劃分架構師 
16.4 按關註層次劃分架構師 
16.5 按口碑劃分架構師 
16.6 非主流方式劃分架構師 
附錄A 大型網站架構技術一覽 
附錄B Web開發技術發展歷程 
後記
目錄結構

 

2. 知識點


 

    1)【軟體視圖模型】     機械製圖的時候,通常使用三視圖描述一個機械零件,從正視、側視、俯視三個角度對一個零件繪圖,從而全面描述一個零件的結構。軟體架構設計中常用的4+1視圖模型,也是一種多角度描述軟體系統設計的手段

  

   2) 【垃圾回收】     JVM為例,其記憶體主要可劃分為堆(heap)和堆棧(stack)。堆棧用於存儲線程上下文信息,如方法參數、局部變數等。堆則是存儲對象的記憶體空間,對象的創建和釋放、垃圾回收就在這裡進行。通過對對象生命周期的觀察,發現大部分對象的生命周期都極其短暫,這部分對象產生的垃圾應該被更快地收集,以釋放記憶體,這就是JVM分代垃圾回收,其

  

  3)【重覆請求】     應用調用服務失敗後,會將調用請求重新發送到其他伺服器,但是這個失敗可能是虛假的失敗。比如服務已經處理成功,但因為網路故障應用沒有收到響應,這時應用重新提交請求就導致服務重覆調用,如果這個服務是一個轉賬操作,就會產生嚴重後果

  

  4)【資料庫連接池】     應用程式的資料庫連接基本都使用連接池(Connection Pool)的方式。資料庫連接對象創建好以後,將連接對象放入對象池容器中,應用程式要連接的時候,就從對象池中獲取一個空閑的連接使用,使用完畢再將該對象歸還到對象池中即可,不需要創建新的連接。       5) 【資料庫索引結構】      目前資料庫多採用兩級索引的B+樹,樹的層次最多三層。因此可能需要5次磁碟訪問才能更新一條記錄(三次磁碟訪問獲得數據索引及行ID,然後再進行一次數據文件讀操作及一次數據文件寫操作)。

 

    6) 【網站的不可用】     網站不可用也被稱作網站故障,業界通常用多少個9來衡量網站的可用性,如QQ的可用性是4個9,即QQ服務99.99%可用,這意味著QQ服務要保證其在所有運行時間中,只有0.01%的時間不可用,也就是一年中大約最多53分鐘不可用。

 

    7) 【冪等性】     數學和電腦概念,任意多次執行所產生的影響均與一次執行的影響相同

 

    8) 【預發佈伺服器】     預發佈伺服器是一種特殊用途的伺服器,它和線上的正式伺服器唯一的不同就是沒有配置在負載均衡伺服器上,外部用戶無法訪問

 

    9)【火車發佈模型】     由於火車發佈模型是基於規則驅動的流程,所以這個流程可以自動化。採用火車發佈模型的網站會開發一個自動化發佈的工具實現發佈過程的自動化。

 

    10) 【網站伸縮性】     一般說來,網站的伸縮性設計可分成兩類,一類是根據功能進行物理分離實現伸縮,一類是單一功能通過集群實現伸縮。前者是不同的伺服器部署不同的服務,提供不同的功能;後者是集群內的多台伺服器部署相同的服務,提供相同的功能。

 

    11)【DNS負載均衡缺點】     但是DNS功能變數名稱解析負載均衡也有缺點,就是目前的DNS是多級解析,每一級DNS都可能緩存A記錄,當下線某台伺服器後,即使修改了DNS的A記錄,要使其生效也需要較長時間,這段時間,DNS依然會將功能變數名稱解析到已經下線的伺服器,導致用戶訪問失敗;而且DNS負載均衡的控制權在功能變數名稱服務商那裡,網站無法對其做更多改善和更強大的管理。

 

    12)【LVS】     使用三角傳輸模式的鏈路層負載均衡是目前大型網站使用最廣的一種負載均衡手段。在Linux平臺上最好的鏈路層負載均衡開源產品是LVS(Linux Virtual Server)。

 

    13)【貧血模型 充血模型】     引申出曠日持久的業務對象貧血模型與充血模型之爭

 

    14)【NoSql的放棄】     NoSQL資料庫產品都放棄了關係資料庫的兩大重要基礎:以關係代數為基礎的結構化查詢語言(SQL)和事務一致性保證(ACID)。而強化其他一些大型網站更關註的特性:高可用性和可伸縮性。     開源社區有各種NoSQL產品,其支持的數據結構和伸縮特性也各不相同,目前看來,應用最廣泛的是Apache HBase。

 

    15)【高手定律。救世主定律】      高手定律:這個世界只有遇不到的問題,沒有解決不了的問題,高手之所以成為高手,是因為他們遇到了常人很難遇到的問題,並解決了。      救世主定律:遇到問題,分析問題,最後總能解決問題

 

    16)【ColumnFamily結構的NoSQL】      而使用支持ColumnFamily結構的NoSQL資料庫,創建表的時候,只需要指定ColumnFamily的名字,無需指定欄位(Column),可以在數據寫入時再指定,通過這種方式,數據表可以包含數百萬的欄位,使得應用程式的數據結構可以隨意擴展。而在查詢時,可以通過指定任意欄位名稱和值進行查詢。

 

    17)【API介面】     API 介面:是開放平臺暴露給開發者使用的一組API,其形式可以是RESTful、WebService、RPC等各種形式。

 

 

 

  18)【信息加密技術】     信息加密技術可分為三類:單項散列加密、對稱加密和非對稱加密。

 

    19)【風控】

    大型電商網站都配備有專門的風控團隊進行風險控制,風控的手段也包括自動和人工兩種。機器自動識別為高風險的交易和信息會發送給風控審核人員進行人工審核,機器自動風控的技術和方法也不斷通過人工發現的新風險類型進行逐步完善。

    機器自動風控的技術手段主要有規則引擎和統計模型。

 

 

  20)【CGI技術】     一般來說CGI技術(廣義上也包括Java Servlet)被稱作腳本模式,CGI程式需要解析HTTP請求,處理業務邏輯,併在輸出流中構造響應信息的HTML。這種技術的優點和缺點是同一個特性——可以在CGI程式中做任何事情。

 

 
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這篇文章主要講解Java在創建對象的時候,初始化的順序。主要從以下幾個例子中講解: 繼承關係中初始化順序 初始化塊與構造器的順序 已經載入過的類的初始化順序 載入父類,會不會載入子類 創建子類對象會不會創建父類對象 例子1——繼承關係中初始化順序 先看簡單的情況,看下麵的例子: 其執行的結果如下: ...
  • YII 2.x 模板文件的 beginBlock、beginContent、beginCache ...
  • 1 #include 2 #include 3 #include 4 struct student //定義結構體 5 { 6 char name[7]; //姓名 7 int number; //號碼 8 }student,student1; 9 void menu() //顯示欄 10 { 11... ...
  • 一.圖片驗證碼概述:很多網站都有該實現作用:為了提高系統的安全性有了驗證碼,我們就可以要求用戶在輸入用戶名,密碼等信息後,同時輸入圖片上的文字,用戶提交後,系統會首先從session中提取剛剛生成的驗證碼,並和用戶輸入的驗證碼進行比較,如果比較相等,表示用戶是從登錄界面登錄過來的,否則,表示用戶是非 ...
  • 在Spring+Struts+Hibernate中,有時需要使用到Spring上下文。項目啟動時,會自動根據applicationContext配置文件初始化上下文,可以使用ApplicationContextAware介面去獲得Spring上下文。創建以下的類: 在applicationConte ...
  • 大家好,今天我們學習了Java如何連接資料庫。之前學過.net語言的資料庫操作,感覺就是一通百通,大同小異。 JDBC是Java資料庫連接技術的簡稱,提供連接各種常用資料庫的能力。 JDBC API (主要功能:與資料庫建立連接、執行語句、處理結果): 提供者:Sun公司 內容:供程式員調用的介面與 ...
  • 首先為什麼要自己編寫Dockerfile來構建 nginx、php、mariadb這三個鏡像呢?一是希望更深入瞭解Dockerfile的使用,也就能初步瞭解docker鏡像是如何被構建的;二是希望將來可以定製自己的images,特別是能針對不同的系統環境與目標需求適當對鏡像進行調整改進。在編輯Doc... ...
  • Chatper 5 原型模式 核心思想是一個對象可以生成與自身相似的其他對象。 基類Monster,有一個抽象方法clone: 1 class Monster 2 { 3 public: 4 5 virtual ~Monster() {} 6 virtual Monster* clone() = 0 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...