WhaleScheduler為銀行業全信創環境打造統一調度管理平臺解決方案

来源:https://www.cnblogs.com/DolphinScheduler/p/18146412
-Advertisement-
Play Games

項目背景 數字金融是數字經濟的重要支撐和驅動力。近年來,我國針對數字金融的發展政策頻頻出台,《金融科技發展規劃 (2022-2025年)》、《“十四五”數字經濟發展規劃》、《關於銀行業保險業數字化轉型的指導意見》、《金融標準化“十 四五”發展規劃》等相繼發佈,頂層設計逐步完善。 2024年,政府工作 ...


file

項目背景

數字金融是數字經濟的重要支撐和驅動力。近年來,我國針對數字金融的發展政策頻頻出台,《金融科技發展規劃 (2022-2025年)》、《“十四五”數字經濟發展規劃》、《關於銀行業保險業數字化轉型的指導意見》、《金融標準化“十 四五”發展規劃》等相繼發佈,頂層設計逐步完善。

2024年,政府工作報告也提出要大力發展科技金融、綠色金融、 普惠金融、養老金融、數字金融,未來數字金融是我國金融發展重點之一。

file
file

我國金融業正在步入數字化轉型的關鍵階段,同時在發展中面臨著諸多挑戰與難點,如數字基礎設施建設不足、數字安全保障機制不健全等。

某國有銀行地區性分行(以下簡稱“銀行”)主動融入數字經濟新浪潮,搶抓機遇、乘勢而上,不斷深化數字化轉型升級,積極加快金融產品融合創新,但是在發展中仍面臨顯著困難。

痛點與挑戰

具體到業務上,銀行需要對總行分發的數據進行載入和轉換,每日任務約 3000。隨著新業務不斷增加,任務總量在 1 萬左右。銀行的業務場景涉及到接收上游系統提供的文件數據,並將數據導入到 GreenPlum 等分析資料庫中進行數據分析。此前,銀行使用自研的調度系統來進行任務的調度,但隨著數據量急劇增長和全新業務場景的出現,這個調度系統陳舊、性能不夠的缺點暴露出來。

總的來說,銀行在數據調度上面臨著以下痛點問題:

  1. 前期自研系統系統靈活性較差,系統維護工作量巨大,跑批出現問題時對業務正常開展產生影響的風險較大,且對於新支持新增業務的需求,需要投入研發人員定製開發;
  2. 不支持分散式系統,擴展性能差,面對急劇增長的數據量無法快速完成擴容;
  3. 業務方涉及不同部門,對程式理解不同,使用習慣也不同,難以滿足所有業務部門的使用需求;
  4. 上游文件數量多,來源廣,並且到達時間不定,需要隨時監控數據到達情況,併在發生異常情況時及時發出告警;
  5. 跨部門使用場景多,需要跨項目依賴和準確的影響分析查詢,便於追溯完整的上下游關係;
  6. 多業務部門使用調度時,無法高效復用已有調度,並限制相關許可權;
  7. 銀行對於信創環境支持的需求越來越緊迫,但苦於原系統無法進行改造以支持信創操作系統、信創伺服器、信創資料庫等信創環境。

項目需求

銀行將緊跟總行的企架各批次分行特色系統建設計劃,推進信創化建設,併發揮科技賦能作用。目標是滿足公司數據體系建設中數據處理任務的統一調度和監控需求,同時推動建設信創下的統一調度管理平臺。

為了實現這一目標,銀行將建立每日流水線任務的集中定義和集中控制機制,允許用戶靈活地配置多種類型的作業任務,並統一調度和監控運維。這個統一調度管理平臺需要具備高性能、高可靠性,同時易於擴展的特點,以滿足銀行在多樣化功能上的開發需求。

最重要的是,流水線任務統一調度管理平臺使銀行能夠全面監控和跟蹤管理各數據加工節點的處理過程,幫助銀行更有效地管理數據處理任務,實現對任務的全面掌控。

針對這些需求,調度系統需要滿足以下要求:

  • 支持分散式的架構及資源控制等方法,實現高可靠性,高處理性能。

  • 支持多種豐富的任務類型,包括Shell、MR、Spark等。

  • 具有良好的管理介面,易於管理,達到簡單易用,使得用戶有流暢的產品體驗。

  • 提供強大的任務執行功能,支持指定任務的運行、空跑測試功能等能力。

  • 提供參數管理和數據源的統一維護能力及日曆管理能力和工作流配置管理能力。

  • 提供完善的監控和告警能力,支持工作流和任務的運行情況統計和監控、任務日誌線上查看、伺服器資源監控、數據質量檢測和告警。

  • 提供監控和統計以及許可權管理功能,支持統一的數據監控、運維服務需求等。

除此之外,調度系統還需要支持用戶的個性化需求,比如通過產品的多樣化結構配置,滿足對接銀行行內登錄、許可權組件、簡訊介面、行信介面、個性化展示頁面,以及20條存量工作流遷移等工作需求。

WhaleScheduler解決方案

白鯨開源自主研發的WhaleScheduler國產信創化調度平臺可支持銀行在數據體系建設中不同場景的任務調度需求,滿足金融行業企業級用戶對系統的穩定性、可靠性、合規性、高性能、支持信創環境等要求。WhaleScheduler為銀行批處理任務制定統一的開發規範、運維方法,對各系統的批量任務進行統一管理、調度和監控,符合銀行不同業務應用環境的性能需求,並提供了私有化部署和開發支持。

01 無中心化架構設計

白鯨開源WhaleScheduler採用先進的無中心架構的設計思想,通過註冊中心發現服務,服務之間可以互為備份,保證了系統的高可靠性的同時,也可以做到水平擴展服務數量,以保持銀行業務的穩定性,很好地支持千萬級別的任務數量。
file
WhaleScheduler 架構圖

02 分散式部署

WhaleScheduler為銀行提供的所有服務均採用分散式部署,支持高穩定性、高性能和高容錯性,保證提供可持續使用的服務。

file

集群部署架構圖

03 多種任務類型

WhaleScheduler支持包括Shell、MR、Spark、SQL(MySQL、PostgreSQL、Hive、SparkSQL)、Python、Sub_Process、Procedure等任務類型,同時具備跨項目依賴和補數功能。

04 全模式DAG開發能力

系統採用全“所見即所得”設計模式,用戶可以通過拖拽,快速生成複雜的DAG任務工作流,而無需掌握大量代碼和大數據底層知識。
file

05 強大的任務執行功能

支持指定任務的運行、空跑測試功能,支持日期參數的輸入,支持多個前置任務狀態的邏輯判斷或前置任務的輸出參數判斷,支持SSH遠程登錄目標伺服器併在其上執行任務等能力。

06 豐富的工作流配置管理能力

支持工作流Excel文件的導入導出、模板與實例分離、多種環境運行任務、靈活的參數定義和傳參功能,以及工作流詳情展示和多種運行策略。

07 監控本地/遠程伺服器文件

系統通過Trigger任務類型支持監控本地/遠程伺服器文件到達事件、資料庫條件成立事件,並提供全局Dashboard,項目Dashboard,支持工作流和任務的運行情況統計和監控、任務日誌線上查看、伺服器資源監控,數據質量檢測,以及郵件、釘釘、企業微信、HTTP、腳本等十餘種告警方式,自定義告警類型也可以輕鬆做到。

08 多樣化的日曆功能

WhaleScheduler提供強大的日曆管理功能,支持不同項目配置獨立的日曆。可視化日曆配置和模板導入導出的維護方式對於銀行工作人員的用戶體驗來說也是非常友好的,創建、編輯、刪除、導入導出等操作方式一目瞭然。如果有需要,用戶還可以按日曆進行調度,也可以基於日曆或翻牌任務獲取日期數據。

file
file

09 任務級血緣分析

銀行跨部門的使用場景需要跨項目依賴和準確的影響分析查詢,這一點非常重要。對此,WhaleScheduler提供了完善的系統影響分析功能,可以分析任務級的血緣,血緣分析包括工作流、任務,工作中的子流程,以及子流程中嵌套的依賴等,讓用戶可以查看完整的任務上下游關係。
file

10 數據質量檢測

銀行的上游數據類型多,來源複雜,數據質量檢測是重要的一環。WhaleScheduler支持數據質量檢測,檢測規則包括不限於空值檢測、枚舉值檢測、表行數校驗、兩表值比對校驗等檢測規則。如果檢測錯誤的數據條數超過閾值,需要告警出來或者工作流失敗停止,用戶可以設置超過閾值告警或讓工作流失敗。

11 用戶角色菜單許可權管控

支持用戶操作審計,設置用戶、角色、資源、許可權來設計不同部門的功能許可權,滿足銀行對安全與許可權的特殊需求。

12 高可伸縮性支持

調度集群能夠隨任務量的增加及時增加資源,持續提供服務。

13 任務維護人員配置

系統設計有完整的用戶管理體系,可以進行任務維護人員的添加、修改和刪除等配置圖片
file

同時,針對銀行提出的個性化功能開發,包括對接行內登錄、許可權組件、簡訊介面、行信介面、個性化展示頁面以及20條存量工作流遷移等工作和現場安裝、調試等工作,白鯨開源派出項目經驗豐富的團隊,採用符合PMI標準的項目管理制度,以滿足銀行不同業務應用環境對性能的需求。

白鯨開源WhaleScheduler為銀行提供了高可靠性、高性能、多場景支持、支持全站華部署運行的強大調度功能,不但可以到銀行各規模、各層次的高可靠性、高安全性、可擴展性和可管理性的要求,還充分考慮到銀行未來3-5年的發展需要,可適應銀行不斷發展的業務和管理需求。

白鯨開源

白鯨開源科技是一家由多名 Apache Software Foundation Member, Apache DolphinScheduler 和 Apache SeaTunnel 核心成員組建的公司。我們致力於打造下一代雲原生 DataOps 平臺,助力企業在大數據和雲時代,智能化地完成海量數據的處理、調度和治理,以提高企業解決數據問題的效率,提升企業分析洞察能力和決策能力。

本文由 白鯨開源 提供發佈支持!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在上一篇中,老周用 .NET Nano Framework 給大伙伴們演示了 WS2812 燈帶的控制,包括用 SPI 和 紅外RMT 的方式。利用 RMT 是一個很機靈的方案,不過,可能很多大伙伴對 ESP32 的 RMT 不是很熟悉。除了樂鑫自己的文檔,沒幾個人寫過相關的水文,可見這裡頭空白的水 ...
  • 聲明: 以下為個人筆記,內容不完全正確,請謹慎參考。 while迴圈 while迴圈結構 while [條件判斷] do 程式 done 腳本示例: 點擊查看代碼 #!/bin/bash while [ $a -le $1] do sum=$[ $sum + $a ] done echo $sum ...
  • /******************************************************************************************************** * * 提高可移植性 Copyright (c) 2023-2024 cececlmx@ ...
  • 為什麼要使用操作系統 使用操作系統的主要原因是為了實現 CPU 多進程分時復用以及記憶體隔離 如果沒有操作系統,應用程式會直接與硬體進行交互,這時應用程式會直接使用 CPU,比如假設只有一個 CPU 核,一個應用程式在這個 CPU 核上運行,但是同時其他程式也需要運行,因為沒有操作系統來幫助切換,就需 ...
  • 系統函數: 1、簡單示例: 點擊查看代碼 #!/bin/bash filename="$1"_log_$(datename +%S) echo $filename basename: 基本語法: basename [string/pathname] [suffix] (功能描述:basename命令 ...
  • 在剛剛過去的2024春季發佈會上,袋鼠雲帶來了數棧產品V6.2版本的全新發佈。其中,EasyMR 作為數棧V6.2中的一項關鍵能力,代表了袋鼠雲對大數據生態的深入理解和持續創新。 EasyMR(後文統稱EMR)是袋鼠雲基於 Hadoop、Hive、Spark、Flink、HBase 等開源組件,構建 ...
  • 1.環境說明 1.1源端SQLSserver 版本 IP 埠 Microsoft SQL Server 2017 192.168.140.160 1433 1.2目標端GreatSQL 版本 IP 埠 GreatSQL-8.0.32 192.168.139.86 3308 2.安裝環境 2.1安 ...
  • 目錄一、什麼是redis Cluster集群二、集群架構圖三、redis Cluster部署架構1、測試環境2、生產環境四、原生命令手動部署Redis Cluster1、環境準備2、為所有節點啟用redis集群支持3、執行meet操作實現互相通信在任意一節點上和其它所有節點進行meet通信,以m1為 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...