Re-Architecting the Video Gatekeeper(二)

来源:https://www.cnblogs.com/zhukunrong/archive/2019/08/18/11374137.html
-Advertisement-
Play Games

原文: https://medium.com/netflix techblog/re architecting the video gatekeeper f7b0ac2f6b00 想法 我們決定部署一個全高密度近場緩存(Hollow)來解決我們的IO瓶頸。對於我們的每個上游系統,我們要建一個能讓Ga ...


原文: https://medium.com/netflix-techblog/re-architecting-the-video-gatekeeper-f7b0ac2f6b00

想法

我們決定部署一個全高密度近場緩存(Hollow)來解決我們的IO瓶頸。對於我們的每個上游系統,我們要建一個能讓Gatekeeper執行這次評估的包括所有數據的Hollow數據集。每個上游系統現在都需要保證它的緩存保持最新。

使用這個模型,活躍性評估將數據從上游系統中隔離出來了。相對於對事件進行響應,Gatekeeper會以一個重覆的周期從遍佈全世界的視頻數據中持續的處理活躍性數據。迭代周期從Netflix的每個視頻上線開始,計算它們的活躍性信息。在每個周期的結束,它產出一個經過計算的表示全世界所有視頻的活躍性明細信息的輸出(包括Hollow數據集)。

我們希望這個持續處理模型是可行的,這樣我們可以徹底移除我們IO上的瓶頸,可以保證操作順序更有效。我們也期望通過遷移到這個模型,我們可以對業務產生更正面的影響。

  • 作為對Gatekeeper對上游系統產生的過大的負載的最終解決方案
  • 徹底消除活躍性處理的延遲和錯過上線日期的問題。
  • 緩解內容配置工程團隊在性能相關問題的時間消耗。
  • 改進活躍性處理的可調試性和可見性

問題

Hollow可以被想象為一個時間機器。作為一個數據一直在變化的數據集,通過將變更分成一系列的時間線的數據狀態並將變更發送給消費方。每份數據狀態都表示為整個數據集在當時時刻的一份快照。

通常,Hollow數據集的消費者將載入的最新的數據狀態並將產生的新狀態保存到他們的混存中。當然,它們可能會將狀態替換到之前的樣子 - 導致將整個數據集指向之前的一個狀態。

傳統產生數據狀態的方式是維護一個運行重覆周期的生產者。在一個周期中,生產者從元數據中迭代所有記錄。在迭代中,它對Hollow庫中增加每條數據。Hollow則在之後計算數據的變化併在最後的周期將數據填加上去,將數據狀態發佈到一個已知地址的消費者。

這個基於真實數據源的迭代模型的問題是它可能會需要很長時間。在這個場景中一些我們的上游系統,這需要幾小時。數據傳播延遲是不可接受的 - 我們不能為活躍性處理等待幾個小時,比如,標題運營給電影增加了一個評級並需要立即發佈上線。

改進

我們需要一個更快的時間機器 - 它可以更頻繁的產出狀態,讓消費方可以更快的識別到變化。

為了達到這個目標,我們建立了一套很強的Hollow基礎設施,平衡了之前Hollow library做的工作,與流處理團隊在Target生產環境做的先鋒性工作(現在是公開的非beta的API)

使用這套基礎設施,每次變更都可以在源應用中唄檢測到,更新過的記錄會被編碼併發送給Kafka topic。一個不屬於源應用的新組件,Hollow增量生產服務,以一個預定義的節奏執行一個重覆周期。 在每個周期,它讀取自從上個周期所有增加到topic的消息,並讓Hollow狀態引擎反映出更新過的記錄的最新狀態。

如果一個Kafka topic中的消息包含了已經在Hollow數據集中已經反映出來的相同數據,不會有任何變動。

為了緩解丟失事件產生的影響,我們實現了一套周期性從整個數據集清掃的機制。當它執行時,它將每條記錄的內容發送給Kafka topic。通過這種方式,任何可能丟失的更新都會反映到Hollow數據集上。並且,這不是更新傳播到Hollow數據集上的主要方式,它不需要像傳統Hollow使用方式那樣很快很頻繁的在源上迭代運行。

Hollow增量生產者有從Kafka topic中讀取大量消息並快速轉變成Hollow狀態的能力 - 所以我們可以將這個周期配置的非常短(我們目前的預設配置是30秒)。

這就是我們如何構建一個更快時間機器的方式。現在,如果標題運營給電影增加了一條評級,在30秒內,數據就可以在Hollow數據集上可用。

本文來自微信公眾號「麥芽麵包,id「darkjune_think」
轉載請註明。微信掃一掃關註公眾號。
交流Email: [email protected]


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. HashMap的內部實現原理是什麼? HashMap內部實現原理是數組+鏈表,通過散列演算法將key值散列到數組中,如果到相同的位置,則通過拉鏈法解決散列衝突。在JDK8中新增了紅黑樹結構,當HashMap中的散列衝突鏈表結構超過8個數據時,會從鏈表結構轉換為紅黑樹結構。 2. HashMap的 ...
  • 系統運行 經過長時間的編碼實現,我們的主體模塊已經大致完成,因為之前我們都是零散的對各個微服務自行測試,接下來,我們需要將所有的服務模塊進行聯調測試,Let's do it. 清除測試數據&測試文件 我們在實現各個服務的過程中,添加了不少的測試文件和測試數據,為了不影響我們最終的展示效果,我們先將之 ...
  • 冒泡排序 原理: 取序列的第一個元素,與序列剩餘的元素比較,如果第一個元素大於剩餘序列的某個元素,那麼就交換他們的位置。 代碼展示: 選擇排序 原理: 首先在未排序的序列中找到最小或最大的元素,存放到序列的起始或末尾位置,然後在從剩餘未排序元素中繼續尋找最小或最大的元素,然後放到剩餘未排序序列的起始 ...
  • 一 什麼是進程 ​ 進程:正在進行的一個過程或者說一個任務。而負責執行任務則是cpu。 ​ 舉例(單核+多道,實現多個進程的併發執行): ​ 太白金星在一個時間段內有很多任務要做:python備課的任務,寫書的任務,交女朋友的任務,王者榮耀上分的任務, ​ 但太白金星同一時刻只能做一個任務(cpu同 ...
  • 今天是第一天學習Python課程,主要從電腦基礎,Python的歷史,環境 ,變數,常量,註釋,用戶交互,基礎數據類型 ,簡單的if條件語句和while迴圈語句這幾個來學習,重點的掌握內容是python的環境,還有python2和python3的區別,常量等。、 1.電腦基礎 cpu:相當於人的 ...
  • Dbutils,db utils,顧名思義,是一個資料庫工具,體積很小,算是一個dao層的小框架。 DbUtils是Apache的開源項目,對JDBC進行了輕量級封裝,極大地簡化了JDBC編程。 DbUtils可以將結果集映射到JavaBean中,這一點和Hibernate很相似,但比Hiberna ...
  • 本文以一個簡單的小例子,簡述SpringMVC開發中RequestMapping的相關應用,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 1、什麼是跨域問題? 跨域問題是瀏覽器對於ajax請求的一種安全限制:一個頁面發起的ajax請求,只能是用當前頁同功能變數名稱同埠的路徑,這能有效的阻止跨站攻擊。 2、跨域問題出現的條件: 1、跨域問題是ajax請求特有的問題。 2、前後端的功能變數名稱、埠不一致。 3、CORS跨域解決原理簡單分析: CORS ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...