Instagram 早期技術架構

来源:https://www.cnblogs.com/edisonfish/archive/2023/11/07/17814328.html
-Advertisement-
Play Games

哈嘍大家好,我是鹹魚 想必大家都聽說過 Instagram ,它是全球最受歡迎的社交媒體平臺之一,擁有數十億的活躍用戶 Instagram 誕生於 2010 年,上線一周就坐擁 10 萬註冊用戶,一年之內就擁有了 1400 萬用戶,可見擴張趨勢突飛猛進。 Instagram 誕生的時候只有 3 個工 ...


哈嘍大家好,我是鹹魚

想必大家都聽說過 Instagram ,它是全球最受歡迎的社交媒體平臺之一,擁有數十億的活躍用戶

Instagram 誕生於 2010 年,上線一周就坐擁 10 萬註冊用戶,一年之內就擁有了 1400 萬用戶,可見擴張趨勢突飛猛進。

Instagram 誕生的時候只有 3 個工程師,想必大家對【他們怎麼設計後端架構,使用了什麼技術來支持這麼多用戶】很感興趣吧,那麼今天我們就來瞭解一下 Instagram 是如何在只有 3 名工程師的情況下擴展到 1400 萬用戶

原文:https://engineercodex.substack.com/p/how-instagram-scaled-to-14-million

從 2010 年 10 月到 2011 年 12 月,Instagram 的用戶在一年多的時間里從 0 增加到1400萬,關鍵是他們只有 3 個工程師

這聽起來是不是很不可思議。據 Instagram 工程師透露,他們通過遵循下麵 3 個關鍵原則並擁有可靠的技術棧來做到這一點:

  • 讓事情變得非常簡單
  • 不要重覆造輪子
  • 儘可能使用經過驗證的可靠技術

技術棧

Instagram 早期的基礎設施運行在 AWS 上,使用 EC2 和 Ubuntu Linux

EC2 是 Amazon 的雲服務,它允許開發人員租用虛擬機

  • 前端 APP

Instagram 最初在 2010 年作為 iOS 應用程式推出。由於 Swift 在 2014 年才發佈,那 Instagram 應該是使用 Objective-C 和 UIKit 等其他語言的組合來編寫的

  • 負載均衡

Instagram 使用了 Amazon 的 Elastic 負載均衡器(Load Balancer)。他們有 3 個 Nginx 實例,Nginx 之間會進行健康檢查以此保證服務高可用

當用戶請求到來時,每個請求會先經過負載均衡器,然後才被轉發到後端實際伺服器

  • 後端服務

Instagram 的應用程式伺服器使用了 Django 框架,它是由 Python 編寫的,而 Gunicorn 是它們的 WSGI 伺服器

WSGI (Web Server Gateway Interface)全稱 web 伺服器網關介面,它會將請求從 web 伺服器轉發到 web 應用程式

在批量管理和自動運維方面,Instagram 通過 Fabric 同時在多個實例上面並行運行命令,做到幾秒鐘內部署代碼

Fabric 是 Python 的一個模塊,基於 SSH 提供了豐富的交互介面,可以用來在本地或遠程機器上自動化的執行 Shel l命令,非常適合用來做應用的遠程部署及系統維護

這些實例在超過25台 Amazon High-CPU Extra-Large 機器上運行。由於伺服器本身是無狀態的,如果需要處理更多請求時,便可以添加更多的機器

  • 一般數據存儲

Instagram 使用了 PostgreSQL 來存儲數據,應用程式伺服器將從 PostgreSQL 中提取數據,PostgreSQL 存儲了 Instagram 的大部分數據,例如用戶和照片元數據

PostgreSQL 和 Django 之間的連接通過 pgbouncer

pgbouncer 是一個 PostgreSQL 連接池

任何目標應用程式都可以像連接 PostgreSQL 伺服器一樣連接到 pgbouncer,並且 pgbouncer 將創建到實際伺服器的連接,或者重用其現有的連接

Instagram 對用戶的數據進行了分片,即使用代碼將幾千個“邏輯”碎片映射到幾個物理碎片,因為收到的數據量很大(每秒超過 25 張照片和 90 個贊)

但是在將數據寫入這組伺服器之前,Instagram 必須解決如何為資料庫中的每條數據分配ID(唯一標識符)的問題

下麵則是 Instagram 中每條數據 ID 包含的內容:

  • 41 位表示時間(以毫秒為單位)
  • 13 位表示邏輯分片 ID
  • 10 位表示自動遞增序列,模數 1024。這意味著我們可以在每毫秒內為每個分片生成 1024 個id

Instagram 的數據分片和 ID 具體是怎麼解決的小伙伴們可以看這篇文章:

https://instagram-engineering.com/sharding-ids-at-instagram-1cf5a71e5a5c

  • 照片數據存儲

對於用戶的照片,Instagram 使用 Amazon S3 來存儲,並且使用 Amazon CloudFront 把照片快速提供給用戶

  • 緩存

Instagram 使用 Redis 將大約 3 億張照片映射到創建它們的用戶 ID 進行存儲,所有 Redis 都存儲在記憶體中以減少延遲,併在多台機器上進行分片。

通過一些巧妙的散列,Instagram 能夠在不到 5 GB 的記憶體中存儲 3 億個鍵映射

對於常規緩存,Instagram 使用了 Memcached。他們當時有 6 個 Memcached 實例。Memcached 相對容易疊加在 Django 上


PostgreSQL 和 Redis 都使用了主從架構,並使用 Amazon EBS(彈性塊存儲)快照對系統進行頻繁備份

  • 推送通知和非同步任務

Instagram 使用 pyapns 來實現,Pyapns 是一個開源的、通用的蘋果推送通知服務(APNS)提供商

在後端,任務被推送到 Gearman,這是一個任務隊列,將工作分配給更適合的機器。Instagram 有 大約 200 名 Python 工作者使用 Gearman 任務隊列

Gearman 常用於多個非同步任務,例如向用戶的所有關註者推送活動(發佈的新照片)

  • 監控

Instagram 使用開源 Django 應用程式 Sentry 來實時監控 Python 錯誤

Munin 用於繪製系統範圍的指標併發出異常警報。Instagram 有一堆自定義的 Munin 插件來跟蹤應用程式級別的指標,例如每秒發佈的照片

Pingdom 用於外部服務監控,PagerDuty 用於處理事件和通知


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 什麼是設計模式? ​ 設計模式(Design pattern)是一套被反覆使用、多數人知曉的、經過分類編目的、代碼設計經驗的總結,設計模式並不是一種固定的公式,而是一種思想,是一種解決問題的思路;使用設計模式是為了可重用代碼,讓代碼更容易被他人理解,保證代碼可維護性。 設計模式不區分編程語言,設計模 ...
  • 一、創建string對象 var strOb = new String("abcefg"); var strOb = String("abcefg"); var strOb = "abcefg"; 二、屬性 length (字元串長度) var str = 'hello'; console.log( ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 前言 在學習Grid佈局之時,我發現其是CSS中的一種強大的佈局方案,它將網頁劃分成一個個網格,可以任意組合不同的網格,做出各種各樣的佈局,在刷某書和某寶首頁時,我們發現其展示方式就是一種瀑布流,是一種流行的網站頁面佈局,視覺表現為參差不 ...
  • 隨著項目的發展,前端SPA應用的規模不斷加大、業務代碼耦合、編譯慢,導致日常的維護難度日益增加。同時前端技術的發展迅猛,導致功能擴展吃力,重構成本高,穩定性低。為了能夠將前端模塊解耦,通過相關技術調研,最終選擇了無界微前端框架作為物流客服系統解耦支持。為了更好的使用無界微前端框架,我們對其運行機制進... ...
  • 引言 前端性能已成為網站和應用成功的關鍵要素之一。用戶期望快速載入的頁面和流暢的交互,而前端框架的選擇對於實現這些目標至關重要。然而,傳統的前端框架在某些情況下可能面臨性能挑戰且存在技術壁壘。 在這個充滿挑戰的背景下,我們引入了 Qwik.js 框架。Qwik.js 不僅是一個前端框架,更是一種前端 ...
  • 本篇文章將解決上一篇文章 結尾遺留的問題:如何讓代碼自動實現響應性? 換句話說就是,如何讓我們的 effect 自動保存 & 自動重新運行?又如何攔截對象屬性的訪問和賦值操作? ...
  • 從接觸領域驅動設計的初學階段,到實現一個舊系統改造到DDD模型,再到按DDD規範落地的3個的項目。對於領域驅動模型設計研發,從開始的各種疑惑到吸收各種先進的理念,目前在技術實施這一塊已經基本比較成熟。在既往經驗中總結了一些在開發中遇到的技術問題和解決方案進行分享。 ...
  • 一、定義 運用共用技術有效地支持大量細粒度對象的復用,享元模式是一種結構型模式。 二、描述 享元模式要求能夠共用的對象必須是細粒度對象,因此它又稱為輕量級模式。享元模式的結構較為複雜,一般結合工廠模式一起使用,在其結構圖中包含了一個享元工廠類,包含以下四個角色: 1、Flyweight(抽象享元類) ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...