Re-Architecting the Video Gatekeeper(一)

-Advertisement-

原文 https://medium.com/netflix techblog/re architecting the video gatekeeper f7b0ac2f6b00 本文介紹了了內容配置工程團隊使用Hollow，一個Netflix OSS技術，重新架構與簡化我們內容管道上的基礎組件在流 ...

原文 https://medium.com/netflix-techblog/re-architecting-the-video-gatekeeper-f7b0ac2f6b00

本文介紹了了內容配置工程團隊使用Hollow，一個Netflix OSS技術，重新架構與簡化我們內容管道上的基礎組件 - 在流程中交付巨大業務價值。

上下文

每個在Netflix服務上的電影和秀都被精心處理以提供最佳的觀看體驗。團隊對處理主要負責標題運營(Title Operation)。標題運營會確認，除了：

我們確保合同符合規範 - 我們為每個標題配置的視頻日期時間段與位置是正確的。
視頻的標題，字幕，第二音軌都被翻譯並被正確分發到世界各地。
標題名與概要都可用並被翻譯。
每個國家都有合適的觀影等級

當標題達到了以上需求的最低要求，它就可以發佈到服務上上線。Gatekeeper是在Netflix負責評估網站上視頻和資產的“活躍度”。在Gatekeeper批准前標題對於會員是不可見的 - 如果它驗證不了設置，它會指出從客戶體驗基線上缺了什麼來輔助標題運營(Title Operation)。

Gatekeeper通過聚合多個上游系統的數據來完成預處理任務，使用合適的業務邏輯，生產和輸出每個國家每個視頻的詳細狀態。

技術

Hollow, 是我們幾年前發佈的OSS技術。並被描述為一種靠近緩存的全高密度(total high-density near cache)技術：

全：在每個節點上都緩存著這個數據集 - 沒有驅逐策略，沒有緩存命中丟失。
高密度：編碼，解碼，反重覆技術都被用來數據集上的記憶體指紋。
靠近：在每個需要存取數據集的實例上都有RAM上的緩存。

對於這個全(total)技術有一個令人興奮的內容 - 因為我們不需要擔心清除記憶體中的數據項，我們可以對記憶體中的數據集展示做一些假設與預計算，沒有這個特性是不可能的。結果是，對許多數據集，提高了很大的記憶體使用效率。而在傳統的部分緩存方案上你可能會想是否你只緩存了5%的數據集，或者你需要被10%保留足夠的空間用來得到一個可接受的命中/丟失率 - 使用同樣的記憶體Hollow可以緩存100%的數據集數據並得到100%的命中率。

很明顯，如果你有100%的命中率，你可以消除所有訪問你數據的IO需求 - 並可以更有效的提高數據訪問效率，可以開啟更多可能性。

現狀

在不久以前，Gatekeeper是一個完全的事件驅動系統。當任何上游系統對視頻有改動，系統會發送給Gatekeeper發送一個事件。Gatekeeper會對那條事件進行響應，進入每一個它的上游服務，收集必要的輸入數據來評估視頻與它的對應資產的活躍性。它會產生一條輸出記錄來輸出這條視頻的詳細狀態。

這個模型有一些相關的問題：

這個進程完全與IO綁定，並對上游系統產生了很大的負載。
因此，這些事件會將一天的吞吐隊列化並產生處理的延遲，導致標題的處理不能及時的上線。
更壞的，事件可能偶爾丟失，這將導致標題不能上線，知道某一個標題運營人員發現可能有問題。

為了減輕這些問題可以“清掃”目錄讓視頻可以匹配特定的查詢條件(比如，計划下周上線)可以讓事件自動註入到處理隊列中。不幸的是，這種方式會往隊列中增加更多的事件，會使問題更加惡化。

很明顯，很有必要改變方向。

本文來自微信公眾號「麥芽麵包，id「darkjune_think」
轉載請註明。微信掃一掃關註公眾號。
交流Email: [email protected]

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

分散式冪等問題解決方案三部曲

歡迎關註公眾號：404P（技術無涯），作者是螞蟻金服的一線開發，分享自己的成長和思考之路。內容涉及數據、工程、演算法。綱要文章目的：本文旨在提煉一套分散式冪等問題的思考框架，而非解決某個具體的分散式冪等問題。在這個框架體系內，會有一些方案舉例說明。文章目標：希望讀者能通過這套思考框架設計出符合自己 ...
java秒殺系列（1）- 秒殺方案總體思路

前言首先，要明確一點，高併發場景下系統的瓶頸出現在哪裡，其實主要就是資料庫，那麼就要想辦法為資料庫做層層防護，減輕資料庫的壓力。一、簡單圖示我用一個比較簡單直觀的圖來表達大概的處理思路二、生產環境中秒殺搶購的解決方案 1、前端 1）、動靜分離，將靜態資源放到第三方雲服務中進行CDN加速，減輕 ...
Java連載15-boolean類型&類型轉換&++運算符

一、boolean類型 1.說明：（1）在java語言中，boolean類型只有兩個值：true、false，沒有其他的值。在C語言中，是有0代表false和1代表true的（2）在底層存儲的時候boolean類型占用1個位元組，因為實際存儲的時候false底層是0，true是1 （3）布爾類型在 ...
pymysql 模塊的使用

pymysql 模塊的使用一、pymysql的下載和使用（1）pymysql模塊的下載（2）pymysql的使用二、execute()之sql註入解決方法：三、增、刪、改：conn.commit() commit()方法：在資料庫里增、刪、改的時候，必須要進行提交，否則插入的數據不生效 ...
Spring 源碼總結

refresh() 1. prepareRefresh() 刷新預處理 1. 設置容器狀態為 active 2. 初始化屬性配置，空方法，可以重寫這個方法來自定義屬性 3. 屬性配置校驗，也是空的 4. 緩存容器中早期事件監聽器 2. obtainFreshBeanFactory() 獲取 Bean ...
Mac安裝Homebrew的那些事兒

Mac安裝Homebrew的那些事兒最近小明剛換置了一個 Mac 本，想搭建一個屬於自己的博客網站，需要用到 Node.js 環境，而Node.js 在 MacOS 中是由 Homebrew 進行安裝管理的……因此，便有了Homebrew的安裝歷程。什麼是Homebrew? 簡而言之，Homeb ...
IDEA運行報錯: Maven編譯錯誤：不再支持源選項 5。請使用 6 或更高版本

這裡記錄下這個問題的解決方案： 1：修改maven settings.xml 中的數據這裡的版本要對應現在使用的jdk版本 2：檢查idea 配置圖中2塊區域要一致檢查這塊地方對應了自己的jdk版本沒有（我的問題就這裡沒對上）對應 jdk版本 3：在項目pom中制定jdk版本以上就是 ...
Java面試，如何在短時間內做突擊

面試前很有必要針對性的多刷題，大部分童鞋實戰能力強，理論不行，面試前不做準備很吃虧。這裡整理了很多常考面試題，希望對你有幫助。面試技術文 Java崗面試考點精講（基礎篇01期） Java崗面試考點精講（基礎篇02期） Java崗面試考點精講（網路篇03期） Java 面試中遇到的坑 Java ...