Flink基本概念_ZenDei技術網路在線

Flink基本概念

-Advertisement-

Flink基本概念 1.The history of Flink？ 2.What is Flink？ Apache Flink是一個開源的分散式、高性能、高可用、準確的流處理框架，主要由Java代碼實現，支持實時流(stream)處理和批(batch)處理，批數據只是流數據的一個極限的特例。原生支持 ...

Flink基本概念

1.The history of Flink？

2.What is Flink？

Apache Flink是一個開源的分散式、高性能、高可用、準確的流處理框架，主要由Java代碼實現，支持實時流(stream)處理和批(batch)處理，批數據只是流數據的一個極限的特例。原生支持了迭代管理、記憶體計算和程式優化。

3.The Feature of Flink？

流式優先(streaming-first：連續處理)，容錯(fault-tolerant：有狀態的計算)，可伸縮(scalable：可支持上千個節點)，性能(performance：高吞吐-每秒處理的數據量很大、低延遲-數據產生時Flink立刻可以處理掉數據的產生到處理間隔的時間很短)。

4.The Architecture of Flink?

(1)部署deploy : 支持local(single jvm)、支持cluster(standalone、yarn)、支持cloud(GCE、EC2) (2)核心core : 分散式流處理框架 (3)APIs : DataStream API、DataSet API (4)Libraries : DataStream API -- CEP、Table，DataSet API -- FLinkML、Gelly、Table

5.The basic components of Flink？

Data Source、Transformations、Data Sink

6.The Distributed Execution about Flink?

7.The different between Batch Processing and Streaming Processing？

流處理是一個節點把一條記錄處理完後序列化到緩存里另一個節點立刻把數據從緩存中拉過去進行處理，批處理是一個節點處理一條記錄放入緩存中另一個節點不會立刻從緩存中拉取記錄直到所有的記錄都執行完為止在統一從緩存裡拉取數據。

8.The diagram of Flink Cluster？

9.The application scene of Flink?

優化電商網站的實時搜索結果如阿裡巴巴的實時更新產品細節使用Flink，實時更新庫存細節使用Blink。

10.Flink vs Storm vs Spark Streaming vs Trident?

Flink可以通過設置閾值來實現流處理或批處理，如果將閾值設為0那麼就相和Storm一樣的實時流處理來一條數據處理一條，真正的實現了低延遲但是相對的吞吐量會降低，如果閾值設為無限大相當於批處理一樣那麼吞吐量會提高卻無法實現低延遲的效果，當然根據實際情況可以吧把值設為合適的值。Storm就是實時流處理來一條數據處理一條，保證數據至少被處理一次，所以可能會處理重覆，其他三者都是保證了僅一次的處理。Spark Streaming是微批處理(mirco-batching)，本質上不屬於實時流處理，而是每隔一定的時間段會處理一次數據,一批一批的小批量處理。Trident是基於Storm的一個封裝，是一批一批的小批量處理。

11.Flink execution process?

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

一條SQL生成數據字典

有個字典表並定期維護，對DBA和開發很重要，終於把他們整合在一起了，看有沒問題？一條SQL生成數據字典，包含所有OPEN用戶、表名、欄位名、欄位序號、欄位屬性、預設值、是否非空、欄位意思、主鍵標識、外鍵標識、主鍵表名、主鍵欄位名、外鍵表名、外鍵欄位名、外鍵名、外鍵標識、外鍵表用戶其中聯合外鍵會出現 ...
mssql sqlserver 驗證整型函數分享

轉自:http://www.maomao365.com/?p=6227 摘要: 下文將製作一個isnumber驗證整型的函數，供在sql腳本中做數值判斷，如下所示: 例: 實現原理:判斷是否包含特殊字元，是否全部為0-9的自然數組成 ...
mongodb查詢資料庫中某個欄位中的值包含某個字元串的方法

正則表達式最能解決：例如：這裡主要是註意正則表達式要寫對，該轉義的註意轉義，否則報錯。 ...
Spark 載入資料庫mysql表中數據進行分析

1.工程maven依賴包 2.spark載入資料庫中數據 3.spark支持載入多種資料庫，僅需要用戶依賴不同的資料庫驅動包，並且代碼進行微調即可根據以上java代碼，僅需調整18行，更改驅動載入類即可。 ...
hive 學習系列六 hive 去重辦法的思考

方法1，建立臨時表，利用hive的collect_set 進行去重。 2，方法2，利用row_number 去重比如，我有一大堆的表格，表格內容大多類似，只是有些許差別。現在的需求是把我要統計所有的表格中，都有哪些欄位，也就是把所有的表格整合成一張大表則可以利用row_number 進行去 ...
Elasticsearch 常用API

1. Elasticsearch 常用API 1.1.數據輸入與輸出 1.1.1.Elasticsearch 文檔 #在 Elasticsearch 中，術語文檔有著特定的含義。它是指最頂層或者根對象, 這個根對象被序列化成 JSON 並存儲到 Elasticsearch 中，指定了唯一 ID。 ...
mssql sqlserver 模擬for迴圈的寫法

轉自:http://www.maomao365.com/?p=6567 摘要: 下文講述sql腳本模擬for迴圈的寫法，如下所示: ...
mssql sqlserver 從指定字元串中獲取數字的方法

轉自:http://www.maomao365.com/?p=6410 摘要: 下文主要分享從指定字元串或列中獲取數字信息，如下所示: 實驗環境:sql server 2000 ...