雲小課|MRS基礎原理之Oozie任務調度

来源:https://www.cnblogs.com/huaweiyun/archive/2022/10/31/16844542.html
-Advertisement-
Play Games

閱識風雲是華為雲信息大咖,擅長將複雜信息多元化呈現,其出品的一張圖(雲圖說)、深入淺出的博文(雲小課)或短視頻(雲視廳)總有一款能讓您快速上手華為雲。更多精彩內容請單擊此處。 摘要:Oozie是一個基於工作流引擎的開源框架,它能夠提供對Hadoop作業的任務調度與協調。Oozie是一個工作流引擎服務 ...


閱識風雲是華為雲信息大咖,擅長將複雜信息多元化呈現,其出品的一張圖(雲圖說)、深入淺出的博文(雲小課)或短視頻(雲視廳)總有一款能讓您快速上手華為雲。更多精彩內容請單擊此處。

摘要:Oozie是一個基於工作流引擎的開源框架,它能夠提供對Hadoop作業的任務調度與協調。Oozie是一個工作流引擎伺服器,用於運行MapReduce任務工作流。同時Oozie還是一個Java Web程式,運行在Tomcat容器中。

本文分享自華為雲社區《【雲小課】EI第41課 MRS基礎原理之Oozie任務調度》,作者: Hello EI。

Oozie是一個基於工作流引擎的開源框架,它能夠提供對Hadoop作業的任務調度與協調。

Oozie是一個工作流引擎伺服器,用於運行MapReduce任務工作流。同時Oozie還是一個Java Web程式,運行在Tomcat容器中。

Oozie工作流通過HPDL(一種通過XML自定義處理的語言,類似JBOSS JBPM的JPDL)來構造。包含“Control Node”(可控制的工作流節點)、“Action Node”。

“Control Node”用於控制工作流的編排,如“start”(開始)、“end”(關閉)、“error”(異常場景)、“decision”(選擇)、“fork”(並行)、“join”(合併)等。

Oozie工作流中擁有多個“Action Node”,如MapReuce、Java等。

所有的“Action Node”以有向無環圖DAG(Direct Acyclic Graph)的模式部署運行。所以在“Action Node”的運行步驟上是有方向的,當上一個“Action Node”運行完成後才能運行下一個“Action Node”。一旦當前“Action Node”完成,遠程伺服器將回調Oozie的介面,這時Oozie又會以同樣的方式執行工作流中的下一個“Action Node”,直到工作流中所有“Action Node”都完成(完成包括失敗)。

Oozie工作流提供各種類型的“Action Node”用於支持不同的業務需要,如MapReduce,HDFS,SSH,Java以及Oozie子流程。

如何使用Oozie

購買包含有Oozie組件的MRS集群後,用戶即可使用Oozie進行作業提交及調度。

MRS集群的創建可參考MRS快速入門中的“創建集群”章節,例如購買MRS 3.1.0普通模式(關閉Kerberos認證)集群。

Oozie客戶端的安裝可以參考MRS用戶指南的“安裝客戶端”章節,例如客戶端安裝目錄為:“/opt/client”。

1.以客戶端安裝用戶,登錄安裝客戶端的節點。

2.執行以下命令,切換到客戶端安裝目錄。

cd /opt/client
source bigdata_env

3.上傳Oozie配置文件以及Jar包至HDFS(UserOozie為提交任務的用戶名)。

hdfs dfs -mkdir /user/UserOozie
hdfs dfs -put -f /opt/client/Oozie/oozie-client-*/examples /user/UserOozie/

4.修改任務執行配置文件:

cd /opt/client/Oozie/oozie-client-*/examples/apps/map-reduce/
vi job.properties
nameNode=hdfs://hacluster 
resourceManager=Yarn ResourceManager主節點IP地址:埠   ##埠可通過“yarn.resourcemanager.port”參數查詢,例如8032。
queueName=default 
examplesRoot=examples 
user.name=admin 
oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/map-reduce #hdfs上傳路徑 
outputDir=map-reduce 
oozie.wf.rerun.failnodes=true

5.運行oozie任務:

oozie job -oozie https://oozie角色的主機名:21003/oozie/ -config job.properties -run
[root@kwephispra44947 map-reduce]# oozie job -oozie https://kwephispra44948:21003/oozie/ -config job.properties -run 
...... 
job: 0000000-200730163829770-oozie-omm-W

6.登錄FusionInsight Manager,選擇“集群 > 服務 > Oozie ”。

7.單擊“oozie WebUI”後的超鏈接進入Oozie頁面,在Oozie的WebUI上查看任務運行結果。

關於Ooize應用開發及相關樣例代碼介紹,請參考《Oozie開髮指南》。

好了,本期雲小課就介紹到這裡,快去體驗MapReduce(MRS)更多功能吧!猛戳這裡

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 今天我們來聊一聊關於JWT授權的事情。 JWT:Json Web Token。顧名思義,它是一種在Web中,使用Json來進行Token授權的方案。 既然沒有找好密碼,token是如何解決信任問題的呢? 解決信任問題,只需要解決兩個問題即可: token是不是來自我信任的機構頒發 token中的信息 ...
  • 場景 我們經常遠程連接伺服器去查看日誌,比較麻煩,如果直接訪問項目的某個頁面就能實時查看日誌就比較奈斯了,花了1天研究了下.net core 日誌的原理,結合blazor實現了基本效果。 實現原理 自定義日誌提供器,將日誌記錄到記憶體中,滾動10W條刪除。 提供blazor組件,實時從記憶體中讀取後顯示 ...
  • 長連接與短連接 所謂長連接,指在一個TCP連接上可以連續發送多個數據包,在TCP連接保持期間,如果沒有數據包發送,需要雙方發檢測包以維持此連接,一般需要自己做線上維持。 短連接是指通信雙方有數據交互時,就建立一個TCP連接,數據發送完成後,則斷開此TCP連接,一般銀行都使用短連接。 比如http的, ...
  • Ubuntu20.04 MRS和Makefile開發環境配置. 使用 MounRiver Studio Community IDE 進行開發是比較簡單的一種方式, 前往http://mounriver.com/download下載 MounRiver_Studio_Community_Linux_V... ...
  • 沁恆最近推出的低價CH32V003系列, 基於青稞RISC-V2A內核, 48MHz主頻, 2KB SRAM, 16KB Flash, 工作電壓相容3.3V和5V. Win10下的開發環境是比較簡單的, 軟體就是MounRiver, 版本v1.82, 軟體集成了代碼編輯, 編譯環境和燒錄工具. 直接... ...
  • 一、FlinkSql的概念 核心概念 Flink 的 Table API 和 SQL 是流批統一的 API。 這意味著 Table API & SQL 在無論有限的批式輸入還是無限的流式輸入下,都具有相同的語義。 因為傳統的關係代數以及 SQL 最開始都是為了批式處理而設計的, 關係型查詢在流式場景 ...
  • 搭建mycat 一、準備工作 1、確保jdk已安裝成功,並且jdk版本選用1.7以上版本 2、準備一臺新的主機mysql_mycat放到master的前面做代理 mycat ip 192.168.232.13 3、將三台機器互做本地解析 192.168.232.11 mysql_master 192 ...
  • TablePlus是一款管理開發資料庫的原生應用,它可以幫助您輕鬆編輯資料庫中的數據和結構。TablePlus還包含許多安全功能以更好地保護您的數據安全,包括使用本地libssh和TLS來加密您的連接等。 Mac版詳情:TablePlus for Mac(原生資料庫開發應用) win版詳情:Tabl ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...