Apache Flink系列-①什麼是Apache Flink？

-Advertisement-

Apache Flink系列-①什麼是Apache Flink？ Apache Flink是一個框架和分散式處理引擎，用於在無界和有界數據流上進行有狀態計算。Flink被設計為在所有常見的集群環境中運行，以記憶體速度和任何規模執行計算。在這裡，我們解釋Flink’s架構重要的各個方面。處理無界和有 ...

Apache Flink系列-①什麼是Apache Flink？

Apache Flink是一個框架和分散式處理引擎，用於在無界和有界數據流上進行有狀態計算。Flink被設計為在所有常見的集群環境中運行，以記憶體速度和任何規模執行計算。

在這裡，我們解釋Flink’s架構重要的各個方面。

處理無界和有界數據

任何類型的數據都是以事件流的形式產生的。信用卡交易、感測器測量、機器日誌或網站或移動應用程式上的用戶交互，所有這些數據都以流的形式生成。

數據可以作為無界流或有界流進行處理。

無界流有起點，但沒有定義的終點。它們不會在生成數據時終止並提供數據。無界流必須持續處理，即事件被攝入後必須立即處理。不可能等待所有輸入數據到達，因為輸入是無限的，在任何時間點都不會完成。處理無界數據通常需要按照特定的順序接收事件，例如事件發生的順序，以便能夠對結果的完整性進行推理。

有界流有一個定義的起點和終點。在執行任何計算之前，可以通過攝取所有數據來處理有界流。處理有界流不需要有序攝取，因為有界數據集總是可以排序的。有界流的處理也稱為批處理。

Apache Flink擅長處理無界和有界數據集。對時間和狀態的精確控制使Flink的運行時能夠在無限流上運行任何類型的應用程式。有界流由專門為固定大小的數據集設計的演算法和數據結構進行內部處理，從而產生優異的性能。

通過探索建立在Flink之上的用例來說服自己。

在任何地方部署應用程式

Apache Flink是一個分散式系統，需要計算資源才能執行應用程式。Flink與所有常見的集群資源管理器（如Hadoop Thread、Apache Mesos和Kubernetes）集成，但也可以設置為作為獨立集群運行。

Flink的設計目的是讓之前列出的每一位資源經理都能很好地工作。這是通過特定於資源管理器的部署模式實現的，這些模式允許Flink以其慣用的方式與每個資源管理器交互。

部署Flink應用程式時，Flink會根據應用程式配置的並行性自動識別所需的資源，並從資源管理器請求這些資源。如果失敗，Flink會通過請求新資源來替換失敗的容器。提交或控制應用程式的所有通信都是通過REST調用進行的。這簡化了Flink在許多環境中的集成。

以任意規模運行應用程式

Flink旨在以任何規模運行有狀態的流媒體應用程式。應用程式被並行化為數千個任務，這些任務在集群中分佈並併發執行。因此，應用程式可以利用幾乎無限量的CPU、主記憶體、磁碟和網路IO。此外，Flink很容易維護非常大的應用程式狀態。它的非同步和增量檢查點演算法確保了對處理延遲的最小影響，同時保證了一次狀態的一致性。

用戶報告稱，在他們的生產環境中運行的Flink應用程式的可擴展性數量令人印象深刻，例如:

l 每天處理數萬億事件的應用程式，
l 維護多TB狀態的應用程式，以及
l 運行在數千個內核上的應用程式

利用記憶體中的性能

有狀態的Flink應用程式針對本地狀態訪問進行了優化。任務狀態始終保持在記憶體中，如果狀態大小超過可用記憶體，則保持在訪問效率高的磁碟數據結構中。因此，任務通過訪問本地（通常在記憶體中）狀態來執行所有計算，從而產生非常低的處理延遲。Flink通過定期、非同步地將本地狀態檢查點設置為持久性存儲，在出現故障時確保一次狀態的一致性。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

MySQL 視圖簡介

概述資料庫中關於數據的查詢有時非常複雜，例如表連接、子查詢等，這種查詢編寫難度大，很容易出錯。另外，在具體操作表時，有時候要求只能操作部分欄位。為了提高複雜 SQL 語句的復用性和表的操作的安全性，MySQL 提供了視圖特性。所謂視圖，本質上是一種虛擬表，同樣包含一系列帶有名稱的列和行數據。行和 ...
MySQL 資料庫中的數據類型

整數類型標準 SQL 中支持 INTEGER 和 SMALLINT 這兩種類型，MySQL 資料庫除了支持這兩種類型以外，還擴展支持了 TINYINT、MEDIUMINT 和 BIGINT 整數類型位元組數無符號數的取值範圍有符號數的取值範圍 TINYINT 1 (0，255) (-128，1 ...
大數據Hadoop之——Spark集群部署（Standalone）

一、Spark概述 Spark基礎概念和原理講解可以參考我上篇博文：大數據Hadoop之——計算引擎Spark 二、Spark的運行模式 1）Standalone（本章講解）獨立模式，自己獨立一套集群(master/client/slave)，Spark 原生的簡單集群管理器，自帶完整的服務， ...
HMS Core Discovery第14期直播預告~縱享絲滑剪輯，釋放視頻創作力

【導讀】拍攝、導入、特效、卡點、BGM…幾步簡單的操作，我們便可將生活的瞬間用視頻記錄與分享。應用前沿AI技術，提供一站式視頻處理能力，幫助開發者們構建更智能、更易用、更專業的視頻剪輯軟體，打造視頻趣味新玩法。 HMS Core Discovery第14期直播將在2022年4月21日19:00開播 ...
node.js -- 身份認證

請問昨天結束的早是對堆積在了今天嗎，今天還來加個班更博，看在這個毅力的份上能否給億點點推薦。有個好消息有個壞消息，先說壞消息吧，就是在這麼學下去我急需急支糖漿，來回顧回顧前面的知識，這幾天學的太急了，搞得有點推著走的意思，好消息就是今天的內容是最後最後node的基礎內容了，果然天不負我，整完然後有 ...
Vue生產環境調試的方法

##背景封樓期間難得空閑，也靜不下心學習，空閑之餘萌生了重做引導單頁的想法。因為之前都是扒站(某大公司游戲官網)+小改，一來雖然很炫酷，但本人水平有限，仍有很大一部分JS無從下手，甚至是看不懂|-_-|；二來對方畢竟沒有開源，無論道德還是法律都說不過去，所以……先從簡單處寫起，後續慢慢迭代吧！ # ...
談談微服務

責任鏈模式是什麼責任鏈模式是一種行為設計模式，允許你將請求沿著處理者鏈進行發送。收到請求後，每個處理者均可對請求進行處理，或將其傳遞給鏈上的下個處理者。為什麼要用責任鏈模式如果有多個對象可以處理同一個請求，具體哪個對象處理該請求由運行時刻自動確定。或者所需處理者及其順序必須在運行時進行 ...
下單流程解耦新方案-你知道Spring事件監聽機制嗎

一、Spring事件監聽介紹 Spring對事件監聽是通過事件類型、事件類型監聽和事件發佈器3個部分來完成的 // 1. 自定義訂單事件 public class OrderEvent extends ApplicationEvent { ... } // 2. 定義訂單監聽器 @Component ...