什麼是實時流式計算?

来源:https://www.cnblogs.com/tree1123/archive/2019/08/09/11325009.html
-Advertisement-
Play Games

實時流式計算,也就是RealTime,Streaming,Analyse,在不同的領域有不同的定義,這裡我們說的是大數據領域的實時流式計算。 實時流式計算,或者是實時計算,流式計算,在大數據領域都是差不多的概念。那麼,到底什麼是實時流式計算呢? 谷歌大神Tyler Akidau在《the world ...


實時流式計算,也就是RealTime,Streaming,Analyse,在不同的領域有不同的定義,這裡我們說的是大數據領域的實時流式計算。
實時流式計算,或者是實時計算,流式計算,在大數據領域都是差不多的概念。那麼,到底什麼是實時流式計算呢?
谷歌大神Tyler Akidau在《the-world-beyond-batch-streaming-101》一文中提到過實時流式計算的三個特征:
1、無限數據
2、無界數據處理
3、低延遲

無限數據指的是,一種不斷增長的,基本上無限的數據集。這些通常被稱為“流數據”,而與之相對的是有限的數據集。
無界數據處理,一種持續的數據處理模式,能夠通過處理引擎重覆的去處理上面的無限數據,是能夠突破有限數據處理引擎的瓶頸的。
低延遲,延遲是多少並沒有明確的定義。但我們都知道數據的價值將隨著時間的流逝降低,時效性將是需要持續解決的問題。

現在大數據應用比較火爆的領域,比如推薦系統在實踐之初受技術所限,可能要一分鐘,一小時,甚至更久對用戶進行推薦,這遠遠不能滿足需要,我們需要更快的完成對數據的處理,而不是進行離線的批處理。
但是這種模型肯定會帶來離線批處理所不存在的兩個問題:正確性與時間。
而這也正是實時流式計算的關鍵點:
1、正確性 一旦正確性有了保證,可以匹敵批處理。
2、時間推導工具 而一旦提供了時間推導的工具,變完全超過了批處理。

總結來說,我們得到的會是一條條的,隨著時間流逝不斷增長的數據,我們需要進行實時的數據分析,我們要解決大數據量,災備,時序,時間視窗,性能等等問題。
而實時,流式其實是相對的概念,現在的很多技術更應該說是近實時,微批。但只要能不斷的優化這些問題,實時流式的計算的價值就會越來越大。

由於大數據興起之初,Hadoop並沒有給出實時計算解決方案,隨後Storm,SparkStreaming,Flink等實時計算框架應運而生,而Kafka,ES的興起使得實時計算領域的技術越來越完善,而隨著物聯網,機器學習等技術的推廣,實時流式計算將在這些領域得到充分的應用。
下麵簡單介紹目前常用的幾種應用場景,未來將對Kafka,Storm,SparkStreaming,Flink等相關技術做具體介紹。

主要應用

1、日誌分析
比如對網站的用戶訪問日誌進行實時的分析,計算訪問量,用戶畫像,留存率等等,實時的進行數據分析,幫助企業進行決策。

2、物聯網
比如對電力系統進行實時的數據檢測,進行報警,實時的顯示,或者根據歷史數據進行實時的分析,預測。

3、車聯網
如今的車聯網已經不限於物聯網,還包括對用戶,交通等等進行分析的一個龐大的系統,改善用戶出行。

4、金融風控
通過對交易等金融行為實時分析,預測出未知風險。

還有很多應用的領域,而且未來會越來越多,在這個過程中具體的業務,以及與技術結合能產生什麼樣的價值,還需要不斷的探索。

《the-world-beyond-batch-streaming-101》地址:
https://www.oreilly.com/ideas/the-world-beyond-batch-streaming-101

更多實時計算相關技術博文,歡迎關註實時計算


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Elasticsearch 如何進行分頁查詢? 如果起始頁、頁大小很大會有性能上的損耗嗎? 本文從分頁查詢開始, 引出其deep paging (即深層分頁) 問題, 並分析其優劣, 給出解決方法. ...
  • 場景 k12線上教育公司的業務場景中,有一些業務場景需要實時統計和分析,如分析線上上課老師數量、學生數量,實時銷售額,課堂崩潰率等,需要實時反應上課的質量問題,以便於對整個公司的業務情況有大致的瞭解。 方案對比 對比了很多解決方案,如下幾種,列出來供參考。 設計方案 實時處理採用Flink SQL, ...
  • 在說正文之前我們先介紹一下redis: redis是當今比較熱門的非關係型資料庫之一,他使用的是key-value的鍵值對來進行存儲,是一個存在於記憶體之中的資料庫,我們一般用於做數據緩存。當我們需要大量的數據查詢時,如果我們都直接訪問資料庫時,會嚴重影響資料庫性能。所以我們一般的操作就是在db層之上 ...
  • AWS Aurora Mysql終於推出了Multi-Master,直面硬剛Oracle RAC。在多一份資料庫產品選擇的小興奮之餘,我們也看看新推出的Multi-Master的特點(包括優缺點)。 ...
  • spark和mapreduce差不多,都是一種計算引擎,spark相對於MapReduce來說,他的區別是,MapReduce會把計算結果放 在磁碟,spark把計算結果既放在磁碟中有放在記憶體中,mapreduce把可能會把一個大任務分成多個stage,瓶頸發生在IO,spark有一個叫DAG(有向 ...
  • 用戶連接到mysql,並做各種查詢,在用戶和伺服器中間分為兩個階段: 1:用戶是否有權連接上來 2:用戶是否有權執行此操作(如select,update等等) 先看第一個階段:伺服器如何判斷用戶是否有權連接上來 依據三個參數: 你從哪來? host 你是誰? user 你的密碼是多少? passwo ...
  • 大A股,股票數據,可用作數據分析練手,每個表和欄位都有註釋; 數據來源:https://tushare.pro/ mysql:連接地址:106.15.47.188: 埠:3306 用戶名:lxd 密碼:laoxiaoduan321 庫名:stocka裡面同步了股票數據,有興趣做分析的可以拿有空的話 ...
  • Redis簡介 Redis是什麼 Redis是一個開源的,使用ANSI C 編寫,高性能的Key Value的NoSQL資料庫。 Redis特點 1. 基於記憶體 2. 可持久化數據 3. 具有豐富的數據結構類型,適應非關係型數據的存儲需求 4. 支持絕大多數主流開發語言,如C、C++、Java、Py ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...