WhaleScheduler為銀行業全信創環境打造統一調度管理平臺解決方案

来源:https://www.cnblogs.com/DolphinScheduler/p/18146412
-Advertisement-
Play Games

項目背景 數字金融是數字經濟的重要支撐和驅動力。近年來,我國針對數字金融的發展政策頻頻出台,《金融科技發展規劃 (2022-2025年)》、《“十四五”數字經濟發展規劃》、《關於銀行業保險業數字化轉型的指導意見》、《金融標準化“十 四五”發展規劃》等相繼發佈,頂層設計逐步完善。 2024年,政府工作 ...


file

項目背景

數字金融是數字經濟的重要支撐和驅動力。近年來,我國針對數字金融的發展政策頻頻出台,《金融科技發展規劃 (2022-2025年)》、《“十四五”數字經濟發展規劃》、《關於銀行業保險業數字化轉型的指導意見》、《金融標準化“十 四五”發展規劃》等相繼發佈,頂層設計逐步完善。

2024年,政府工作報告也提出要大力發展科技金融、綠色金融、 普惠金融、養老金融、數字金融,未來數字金融是我國金融發展重點之一。

file
file

我國金融業正在步入數字化轉型的關鍵階段,同時在發展中面臨著諸多挑戰與難點,如數字基礎設施建設不足、數字安全保障機制不健全等。

某國有銀行地區性分行(以下簡稱“銀行”)主動融入數字經濟新浪潮,搶抓機遇、乘勢而上,不斷深化數字化轉型升級,積極加快金融產品融合創新,但是在發展中仍面臨顯著困難。

痛點與挑戰

具體到業務上,銀行需要對總行分發的數據進行載入和轉換,每日任務約 3000。隨著新業務不斷增加,任務總量在 1 萬左右。銀行的業務場景涉及到接收上游系統提供的文件數據,並將數據導入到 GreenPlum 等分析資料庫中進行數據分析。此前,銀行使用自研的調度系統來進行任務的調度,但隨著數據量急劇增長和全新業務場景的出現,這個調度系統陳舊、性能不夠的缺點暴露出來。

總的來說,銀行在數據調度上面臨著以下痛點問題:

  1. 前期自研系統系統靈活性較差,系統維護工作量巨大,跑批出現問題時對業務正常開展產生影響的風險較大,且對於新支持新增業務的需求,需要投入研發人員定製開發;
  2. 不支持分散式系統,擴展性能差,面對急劇增長的數據量無法快速完成擴容;
  3. 業務方涉及不同部門,對程式理解不同,使用習慣也不同,難以滿足所有業務部門的使用需求;
  4. 上游文件數量多,來源廣,並且到達時間不定,需要隨時監控數據到達情況,併在發生異常情況時及時發出告警;
  5. 跨部門使用場景多,需要跨項目依賴和準確的影響分析查詢,便於追溯完整的上下游關係;
  6. 多業務部門使用調度時,無法高效復用已有調度,並限制相關許可權;
  7. 銀行對於信創環境支持的需求越來越緊迫,但苦於原系統無法進行改造以支持信創操作系統、信創伺服器、信創資料庫等信創環境。

項目需求

銀行將緊跟總行的企架各批次分行特色系統建設計劃,推進信創化建設,併發揮科技賦能作用。目標是滿足公司數據體系建設中數據處理任務的統一調度和監控需求,同時推動建設信創下的統一調度管理平臺。

為了實現這一目標,銀行將建立每日流水線任務的集中定義和集中控制機制,允許用戶靈活地配置多種類型的作業任務,並統一調度和監控運維。這個統一調度管理平臺需要具備高性能、高可靠性,同時易於擴展的特點,以滿足銀行在多樣化功能上的開發需求。

最重要的是,流水線任務統一調度管理平臺使銀行能夠全面監控和跟蹤管理各數據加工節點的處理過程,幫助銀行更有效地管理數據處理任務,實現對任務的全面掌控。

針對這些需求,調度系統需要滿足以下要求:

  • 支持分散式的架構及資源控制等方法,實現高可靠性,高處理性能。

  • 支持多種豐富的任務類型,包括Shell、MR、Spark等。

  • 具有良好的管理介面,易於管理,達到簡單易用,使得用戶有流暢的產品體驗。

  • 提供強大的任務執行功能,支持指定任務的運行、空跑測試功能等能力。

  • 提供參數管理和數據源的統一維護能力及日曆管理能力和工作流配置管理能力。

  • 提供完善的監控和告警能力,支持工作流和任務的運行情況統計和監控、任務日誌線上查看、伺服器資源監控、數據質量檢測和告警。

  • 提供監控和統計以及許可權管理功能,支持統一的數據監控、運維服務需求等。

除此之外,調度系統還需要支持用戶的個性化需求,比如通過產品的多樣化結構配置,滿足對接銀行行內登錄、許可權組件、簡訊介面、行信介面、個性化展示頁面,以及20條存量工作流遷移等工作需求。

WhaleScheduler解決方案

白鯨開源自主研發的WhaleScheduler國產信創化調度平臺可支持銀行在數據體系建設中不同場景的任務調度需求,滿足金融行業企業級用戶對系統的穩定性、可靠性、合規性、高性能、支持信創環境等要求。WhaleScheduler為銀行批處理任務制定統一的開發規範、運維方法,對各系統的批量任務進行統一管理、調度和監控,符合銀行不同業務應用環境的性能需求,並提供了私有化部署和開發支持。

01 無中心化架構設計

白鯨開源WhaleScheduler採用先進的無中心架構的設計思想,通過註冊中心發現服務,服務之間可以互為備份,保證了系統的高可靠性的同時,也可以做到水平擴展服務數量,以保持銀行業務的穩定性,很好地支持千萬級別的任務數量。
file
WhaleScheduler 架構圖

02 分散式部署

WhaleScheduler為銀行提供的所有服務均採用分散式部署,支持高穩定性、高性能和高容錯性,保證提供可持續使用的服務。

file

集群部署架構圖

03 多種任務類型

WhaleScheduler支持包括Shell、MR、Spark、SQL(MySQL、PostgreSQL、Hive、SparkSQL)、Python、Sub_Process、Procedure等任務類型,同時具備跨項目依賴和補數功能。

04 全模式DAG開發能力

系統採用全“所見即所得”設計模式,用戶可以通過拖拽,快速生成複雜的DAG任務工作流,而無需掌握大量代碼和大數據底層知識。
file

05 強大的任務執行功能

支持指定任務的運行、空跑測試功能,支持日期參數的輸入,支持多個前置任務狀態的邏輯判斷或前置任務的輸出參數判斷,支持SSH遠程登錄目標伺服器併在其上執行任務等能力。

06 豐富的工作流配置管理能力

支持工作流Excel文件的導入導出、模板與實例分離、多種環境運行任務、靈活的參數定義和傳參功能,以及工作流詳情展示和多種運行策略。

07 監控本地/遠程伺服器文件

系統通過Trigger任務類型支持監控本地/遠程伺服器文件到達事件、資料庫條件成立事件,並提供全局Dashboard,項目Dashboard,支持工作流和任務的運行情況統計和監控、任務日誌線上查看、伺服器資源監控,數據質量檢測,以及郵件、釘釘、企業微信、HTTP、腳本等十餘種告警方式,自定義告警類型也可以輕鬆做到。

08 多樣化的日曆功能

WhaleScheduler提供強大的日曆管理功能,支持不同項目配置獨立的日曆。可視化日曆配置和模板導入導出的維護方式對於銀行工作人員的用戶體驗來說也是非常友好的,創建、編輯、刪除、導入導出等操作方式一目瞭然。如果有需要,用戶還可以按日曆進行調度,也可以基於日曆或翻牌任務獲取日期數據。

file
file

09 任務級血緣分析

銀行跨部門的使用場景需要跨項目依賴和準確的影響分析查詢,這一點非常重要。對此,WhaleScheduler提供了完善的系統影響分析功能,可以分析任務級的血緣,血緣分析包括工作流、任務,工作中的子流程,以及子流程中嵌套的依賴等,讓用戶可以查看完整的任務上下游關係。
file

10 數據質量檢測

銀行的上游數據類型多,來源複雜,數據質量檢測是重要的一環。WhaleScheduler支持數據質量檢測,檢測規則包括不限於空值檢測、枚舉值檢測、表行數校驗、兩表值比對校驗等檢測規則。如果檢測錯誤的數據條數超過閾值,需要告警出來或者工作流失敗停止,用戶可以設置超過閾值告警或讓工作流失敗。

11 用戶角色菜單許可權管控

支持用戶操作審計,設置用戶、角色、資源、許可權來設計不同部門的功能許可權,滿足銀行對安全與許可權的特殊需求。

12 高可伸縮性支持

調度集群能夠隨任務量的增加及時增加資源,持續提供服務。

13 任務維護人員配置

系統設計有完整的用戶管理體系,可以進行任務維護人員的添加、修改和刪除等配置圖片
file

同時,針對銀行提出的個性化功能開發,包括對接行內登錄、許可權組件、簡訊介面、行信介面、個性化展示頁面以及20條存量工作流遷移等工作和現場安裝、調試等工作,白鯨開源派出項目經驗豐富的團隊,採用符合PMI標準的項目管理制度,以滿足銀行不同業務應用環境對性能的需求。

白鯨開源WhaleScheduler為銀行提供了高可靠性、高性能、多場景支持、支持全站華部署運行的強大調度功能,不但可以到銀行各規模、各層次的高可靠性、高安全性、可擴展性和可管理性的要求,還充分考慮到銀行未來3-5年的發展需要,可適應銀行不斷發展的業務和管理需求。

白鯨開源

白鯨開源科技是一家由多名 Apache Software Foundation Member, Apache DolphinScheduler 和 Apache SeaTunnel 核心成員組建的公司。我們致力於打造下一代雲原生 DataOps 平臺,助力企業在大數據和雲時代,智能化地完成海量數據的處理、調度和治理,以提高企業解決數據問題的效率,提升企業分析洞察能力和決策能力。

本文由 白鯨開源 提供發佈支持!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在上一篇中,老周用 .NET Nano Framework 給大伙伴們演示了 WS2812 燈帶的控制,包括用 SPI 和 紅外RMT 的方式。利用 RMT 是一個很機靈的方案,不過,可能很多大伙伴對 ESP32 的 RMT 不是很熟悉。除了樂鑫自己的文檔,沒幾個人寫過相關的水文,可見這裡頭空白的水 ...
  • 聲明: 以下為個人筆記,內容不完全正確,請謹慎參考。 while迴圈 while迴圈結構 while [條件判斷] do 程式 done 腳本示例: 點擊查看代碼 #!/bin/bash while [ $a -le $1] do sum=$[ $sum + $a ] done echo $sum ...
  • /******************************************************************************************************** * * 提高可移植性 Copyright (c) 2023-2024 cececlmx@ ...
  • 為什麼要使用操作系統 使用操作系統的主要原因是為了實現 CPU 多進程分時復用以及記憶體隔離 如果沒有操作系統,應用程式會直接與硬體進行交互,這時應用程式會直接使用 CPU,比如假設只有一個 CPU 核,一個應用程式在這個 CPU 核上運行,但是同時其他程式也需要運行,因為沒有操作系統來幫助切換,就需 ...
  • 系統函數: 1、簡單示例: 點擊查看代碼 #!/bin/bash filename="$1"_log_$(datename +%S) echo $filename basename: 基本語法: basename [string/pathname] [suffix] (功能描述:basename命令 ...
  • 在剛剛過去的2024春季發佈會上,袋鼠雲帶來了數棧產品V6.2版本的全新發佈。其中,EasyMR 作為數棧V6.2中的一項關鍵能力,代表了袋鼠雲對大數據生態的深入理解和持續創新。 EasyMR(後文統稱EMR)是袋鼠雲基於 Hadoop、Hive、Spark、Flink、HBase 等開源組件,構建 ...
  • 1.環境說明 1.1源端SQLSserver 版本 IP 埠 Microsoft SQL Server 2017 192.168.140.160 1433 1.2目標端GreatSQL 版本 IP 埠 GreatSQL-8.0.32 192.168.139.86 3308 2.安裝環境 2.1安 ...
  • 目錄一、什麼是redis Cluster集群二、集群架構圖三、redis Cluster部署架構1、測試環境2、生產環境四、原生命令手動部署Redis Cluster1、環境準備2、為所有節點啟用redis集群支持3、執行meet操作實現互相通信在任意一節點上和其它所有節點進行meet通信,以m1為 ...
一周排行
    -Advertisement-
    Play Games
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...
  • 目錄前言PostgreSql安裝測試額外Nuget安裝Person.cs模擬運行Navicate連postgresql解決方案Garnet為什麼要選擇Garnet而不是RedisRedis不再開源Windows版的Redis是由微軟維護的Windows Redis版本老舊,後續可能不再更新Garne ...
  • C#TMS系統代碼-聯表報表學習 領導被裁了之後很快就有人上任了,幾乎是無縫銜接,很難讓我不想到這早就決定好了。我的職責沒有任何變化。感受下來這個系統封裝程度很高,我只要會調用方法就行。這個系統交付之後不會有太多問題,更多應該是做小需求,有大的開發任務應該也是第二期的事,嗯?怎麼感覺我變成運維了?而 ...
  • 我在隨筆《EAV模型(實體-屬性-值)的設計和低代碼的處理方案(1)》中介紹了一些基本的EAV模型設計知識和基於Winform場景下低代碼(或者說無代碼)的一些實現思路,在本篇隨筆中,我們來分析一下這種針對通用業務,且只需定義就能構建業務模塊存儲和界面的解決方案,其中的數據查詢處理的操作。 ...
  • 對某個遠程伺服器啟用和設置NTP服務(Windows系統) 打開註冊表 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Time\TimeProviders\NtpServer 將 Enabled 的值設置為 1,這將啟用NTP伺服器功 ...
  • title: Django信號與擴展:深入理解與實踐 date: 2024/5/15 22:40:52 updated: 2024/5/15 22:40:52 categories: 後端開發 tags: Django 信號 松耦合 觀察者 擴展 安全 性能 第一部分:Django信號基礎 Djan ...
  • 使用xadmin2遇到的問題&解決 環境配置: 使用的模塊版本: 關聯的包 Django 3.2.15 mysqlclient 2.2.4 xadmin 2.0.1 django-crispy-forms >= 1.6.0 django-import-export >= 0.5.1 django-r ...
  • 今天我打算整點兒不一樣的內容,通過之前學習的TransformerMap和LazyMap鏈,想搞點不一樣的,所以我關註了另外一條鏈DefaultedMap鏈,主要調用鏈為: 調用鏈詳細描述: ObjectInputStream.readObject() DefaultedMap.readObject ...
  • 後端應用級開發者該如何擁抱 AI GC?就是在這樣的一個大的浪潮下,我們的傳統的應用級開發者。我們該如何選擇職業或者是如何去快速轉型,跟上這樣的一個行業的一個浪潮? 0 AI金字塔模型 越往上它的整個難度就是職業機會也好,或者說是整個的這個運作也好,它的難度會越大,然後越往下機會就會越多,所以這是一 ...
  • @Autowired是Spring框架提供的註解,@Resource是Java EE 5規範提供的註解。 @Autowired預設按照類型自動裝配,而@Resource預設按照名稱自動裝配。 @Autowired支持@Qualifier註解來指定裝配哪一個具有相同類型的bean,而@Resourc... ...