CDN概念 CDN全稱叫做“Content Delivery Network”,中文叫內容分髮網絡。 原理分析 我們知道,當我們使用功能變數名稱訪問某一個網站時,實際上就是將請求包(以Http請求為例)通過網路傳輸給某台伺服器,比如訪問“www.baidu.com”時: 首先解析出該功能變數名稱所對應的IP地址(D ...
CDN概念 CDN全稱叫做“Content Delivery Network”,中文叫內容分髮網絡。 原理分析 我們知道,當我們使用功能變數名稱訪問某一個網站時,實際上就是將請求包(以Http請求為例)通過網路傳輸給某台伺服器,比如訪問“www.baidu.com”時: 首先解析出該功能變數名稱所對應的IP地址(DNS功能變數名稱解析) 然後將Http請求包通過網路路由到IP地址所對應的伺服器 我們通常說“伺服器的IP地址”,這其實不太準確,IP地址是和網卡綁定的,一個伺服器可以有多個網卡,也就是可能有多個IP地址。 我們先來看第一步:功能變數名稱解析 功能變數名稱解析 解析功能變數名稱分為兩種: 將一個功能變數名稱解析為一個IP地址 將一個功能變數名稱解析為另外一個功能變數名稱 其實解析思路不難,我們在功能變數名稱服務商購買了一個功能變數名稱之後,需要去映射一個IP地址,可以用Map來表示這個關係:{功能變數名稱:IP}。 同時我們也可以給某個功能變數名稱取一個別名,比如“www.baidu.com”取一個別名“test.baidu.com”,這種關係也可以用Map來表示:{功能變數名稱:別名}。這裡的別名專業一點叫做CNAME,相信大家對這個詞有點眼熟,它就是這個意思。 而功能變數名稱解析,實際上就是解析出指定功能變數名稱所對應的IP地址,或者該功能變數名稱的一個CNAME。 而功能變數名稱解析是由DNS系統來負責的,DNS服務接受外部請求,從請求里提取功能變數名稱, 如果這個功能變數名稱對應的是IP地址,則返回這個IP地址, 如果這個功能變數名稱對應的是CNAME,則繼續查找CNAME功能變數名稱的IP地址,然後將該地址返回給請求發送者。 請求發送者拿到IP地址之後,完成真正的請求調用。 實際上DNS系統是非常龐大的,這裡不去多將,大家把它當作一個黑盒子,這個盒子的作用就是上文所描述的,這裡用一個簡單的圖來表示一下。 沒有CNAME的情況:
有CNAME的情況:
特別註意:在有CNAME的情況下,我們可以發現,CNAME實際上在功能變數名稱解析的過程中承擔了中間人(或者說代理)的角色,這是CDN實現的關鍵。
CDN原理 首先CDN是為了改善互聯網的服務質量的**。**通俗一點說其實就是提高訪問速度。 假設百度網站現在只有一臺伺服器,現在有一個人在上海訪問百度,如果該伺服器也在上海,那麼通常來說訪問比較快,如果該伺服器在拉薩,那麼相對而言訪問就比較慢了。那麼這個問題的根本原因是網路傳輸是依賴於網線的,網線越長,那麼時間肯定就越久。 那麼怎麼解決這個問題呢?其實思路很簡單,百度在全國各地都部署一模一樣的伺服器就行了,專業一點叫冗餘。 思路很簡單,但實現還是比較麻煩的,伺服器上的資源分為兩種:靜態資源與動態資源。 靜態資源:這種資源通常是很少變動的,比如圖片,視頻,css,javascript等等 動態資源:這種資源不同用戶不同時刻訪問通常是不一樣的,比入php、jsp等等。 那麼如果百度要在全國各地都部署伺服器,如果說每個伺服器上都有相同的動態資源,那麼可能還需要配置相應的資料庫,因為動態資源所記錄的信息通常會存儲在資料庫中,那麼這就涉及到了數據同步等等問題,這會導致成本很高,這種做法專業一點其實就是**集群,而目前來說集群架構最多是三地五中心,**不是說全國多地集群不可能,主要是成本太高。 那麼有沒有成本比較低的方式呢,有,就是在每個伺服器上只部署靜態資源,靜態資源通常不涉及到資料庫,所以成本也比較低,而且也能提高用戶的訪問速度。 到這裡,介紹了CDN想要達到的目的,那麼怎麼達到這個目的呢? 現在如果要比較CDN系統,我們可以考慮兩點: 1.CDN系統中存儲靜態資源伺服器的性能以及網速怎麼樣。 2.CDN系統中全國甚至全球範圍內伺服器節點的數量以及部署情況。 第一點很好理解,第二點大家應該也能理解了,如果靜態資源的伺服器節點很多,能夠讓每個用戶在訪問這些靜態資源時都不用“跑很遠的路程”才能獲取到,那麼自然這是CDN系統的優點。 有公司看到了這種需求,所以現在其實有很多CDN供應商,比如阿裡,騰訊等等都有自己的CDN服務。只要你自己的系統接入了這些大廠所提供的CDN服務,你把自己的靜態資源傳給CDN服務,那麼這些靜態資源將自動的分佈到全世界各地去。 好,那麼現在的問題是,用戶在訪問靜態資源時也是通過功能變數名稱來訪問的,功能變數名稱會被解析成某一個IP地址,關鍵的問題就是,DNS系統怎麼在做功能變數名稱解析時,解析出來一個離用戶最近的一個IP地址呢。 普通的DNS系統是做不到的,需要一個特殊的DNS伺服器,這個特殊DNS需要知道 用戶當前所在位置 還需要知道用戶現在訪問的這個功能變數名稱對應哪些IP地址,以及這個IP地址分別在哪? 對於第一個問題好解決,直接從用戶請求里提取出用戶的ip地址,比如這個ip地址被解析為北京電信、上海移動等等。 第二個問題由誰來解決,我們現在考慮的是CDN,CDN提供商肯定知道他們公司在哪些地方部署了機器以及它們的IP地址,所以這個問題只能有CDN提供商來解決,CDN提供商會提供這個特殊的DNS伺服器,我們叫做 CDN專用DNS伺服器。 這樣的話,只要用戶在使用某個功能變數名稱訪問靜態資源時,如果用戶直接配置自己電腦的DNS地址為CDN專用DNS伺服器。那麼自然解決了問題,但是我們需要考慮的時,我們不能要求世界上所有的用戶都去修改自己電腦的DNS地址。所以這個時候就要利用DNS中的CNAME了。 用戶使用某個功能變數名稱來訪問靜態資源時(這個功能變數名稱在阿裡CDN服務中叫做“加速功能變數名稱”),比如這個功能變數名稱為“image.baidu.com”,它對應一個CNAME,叫做“cdn.ali.com”,那麼普通DNS伺服器(區別CDN專用DNS伺服器)在解析“image.baidu.com”時,會先解析成“cdn.ali.com”,普通DNS伺服器發現該功能變數名稱對應的也是一個DNS伺服器,那麼會將功能變數名稱解析工作轉交給該DNS伺服器,該DNS伺服器就是CDN專用DNS伺服器。CDN專用DNS伺服器對“cdn.ali.com”進行解析,然後依據伺服器上記錄的所有CDN伺服器地址信息,選出一個離用戶最近的一個CDN伺服器地址,並返回給用戶,用戶即可訪問離自己最近的一臺CDN伺服器了。 對於更多關於架構中需要提速的內容,大家可以加入到架構學習交流群來進一步的研討。歡迎大家發佈討論