銀行機構數據治理案例解讀,構建全行數據資產體系

来源:https://www.cnblogs.com/DTinsight/archive/2023/07/14/17554513.html
-Advertisement-
Play Games

近年來,隨著信息化、數字化、智能化的快速發展,數據從資源逐漸轉變為資產。金融行業具有海量數據資源和豐富應用場景優勢,在企業經營管理、產品研發、技術創新等關鍵環節中發揮著重要作用。[數據治理](https://www.dtstack.com/?src=szsm=06)作為釋放數據價值的基礎,在推動銀行 ...


近年來,隨著信息化、數字化、智能化的快速發展,數據從資源逐漸轉變為資產。金融行業具有海量數據資源和豐富應用場景優勢,在企業經營管理、產品研發、技術創新等關鍵環節中發揮著重要作用。數據治理作為釋放數據價值的基礎,在推動銀行數字化轉型的過程中扮演了“承上啟下”的關鍵角色。

通過數據治理咨詢,結合數據平臺建設和數據應用實施,構建科學的組織架構體系,完善數據治理流程制度與規範,建立數字化協同機制,整合併打通銀行內多源、零散的異構數據體系,構建全行業數據資產體系,完善數據許可權、數據血緣、數據質量、分級分類等管理體系,藉助數據產品對數據資產進行深度加工挖掘價值,面向零售、風險、財務等輸出更加全面的數據及統計指標,推動銀行業務數字化轉型。

銀行機構數據治理解決方案

基於數據盤點構建全行級數據資源目錄

數據資產盤點有實體盤點,第一點是設計分類框架,為了方便對數據資產進行管理,需要對數據資產進行分類,按照業內慣例,一般分為三級分類。分類依據可參考企業的流程框架,按照業務分類進行分類。

第二點是明確盤點範圍,對人力、財務、營銷業務系統中的業務對象進行盤點,需要系統開發人員、業務人員共同參與,解決梳理過程中遇到的業務和技術問題。

第三點要註意盤點的內容,也就是盤點業務實體對象

除了實體盤點外還有數據項盤點。數據項的盤點依賴於實體的盤點,每個實體有若幹個數據項,數據項是業務開展的基礎屬性,這些屬性可以從業務系統界面獲取,也可以從後臺獲取。

file

基於數據標準的規範化ETL數據建模體系

數據標準是進行數據標準化、消除數據業務歧義的主要參考和依據。對數據標準進行分類,將有利於數據標準的編製、查詢、落地和維護。數據標準有多種分類方式,對於不同的分類方式,均可採用以數據元為數據標準制定的基本單元構建數據標準體系。

數據可以分為基礎類數據和指標類數據。基礎類數據指業務流程中直接產生的,未經過加工和處理的基礎業務信息。指標類數據是指具備統計意義的基礎類數據,通常由一個或以上的基礎數據根據一定的統計規則計算而得到。

相應地,數據標準也可以分為基礎類數據標準或指標類數據標準。基礎類數據標準是為了統一企業所有業務活動相關數據的一致性和準確性,解決業務間數據一致性和數據整合,按照數據標準管理過程制定的數據標準。指標類數據標準一般分為基礎指標標準和計算指標(又稱組合指標)標準。

基礎類數據標準和指標類數據標準通過分別建立基礎類數據元和指標類數據元,並將基礎類數據元和指標類數據元與數據映射,實現基礎類數據標準和指標類數據標準的落地。

具體來說,對於結構化數據中的任意一個欄位,當其不具備指標特征時,可直接將其與某一業務類別下的基礎類數據元(如包含命名規則、數據類型和值域等屬性)映射,實現該欄位的標準化(符合命名規則、數據類型和值域的規定);當其具備指標特征時,可直接將其與某一業務類別下的指標類數據元(如命名規則、約束規則、數據類型和值域等)映射,實現該欄位的標準化(符合命名規則、約束規則、數據類型和值域的規定)。

file

基於法律法規構建數據分級分類體系

根據《個人金融信息保護技術規範》(JR/T 0171-2020)及《某銀行數據安全管理辦法》要求,個人客戶C3、C2類別信息在後臺管理與業務支撐系統展示時,除銀行卡有效期外,C3 類別信息不應明文展示;C2類中支付賬號、客戶法定名稱、支付預留手機號碼、證件類或其他類識別標識信息應當做遮蔽處理,且不提供批量查詢和批量下載功能。

如特殊情況C2類上述敏感欄位仍需完整展示或明文下載,則必須有如下管控措施:

1)需求提出部門必須限定最小用戶使用範圍,並經過本部門總經理(如果是分行,則為分行主要負責人)審批授權。審批單參照《某銀行個人分類分級數據授權審批單》,併在OA項目需求發起時必須含有該審批單附件。

2)系統內應當做好相關角色許可權的設置和管控。

3)C2類中支付賬號、客戶法定名稱、支付預留手機號碼、證件類或其他類識別標識信息前臺頁面展現需增加水印處理,禁止複製粘貼;且批量下載時文件必須通過DRM加密,並經過審批授權流程,審批授權至少至分管部門總經理或分行主要負責人。

4)個人客戶C2類敏感信息在做批量查詢或者下載必須有審計日誌功能,必須明確誰在什麼時間,什麼場景使用,使用許可權範圍,審批流程等,日誌支持前臺頁面查詢。

5)所有數據使用均遵循“誰使用誰負責”的原則。

6)以上管控措施涉及應用系統開發的,應該在開發全流程中形成閉環管控機制(包含相關業務需求的提出到業務驗收測試環節)。對於涉及上述敏感信息展示但沒有提供經領導審批的《某銀行個人分類分級數據授權審批單》,一律不予啟動開發。

7)涉及業務部門授權審批的管理環節,需求提出部門需要做好相關審批授權文檔的存檔,以備後續審查。

file

銀行機構數據治理交付內容

數據治理咨詢

協助完善數據治理組織架構(涵蓋數據治理決策層、管理層和執行層)及數據治理相關的制度、流程和評估標準。完善數據標準,完成10個系統的數據對標,並完成主數據和元數據的梳理。建立數據質量的檢核、整改、評價等工作流程,提升數據質量。制定數據資產盤點、評估與管理工作機制,完成10個系統的數據資產盤點。構建指標管理體系,協助梳理全行基礎指標。

數據平臺建設

數據平臺包含數據治理平臺和數據應用平臺,實現數據的“管、 治、用”。數據治理平臺提供離線開發、數據標準、數據建模、數據質量、主數據、元數據、指標管理、數據資產和數據安全等功能,實現數據開發與治理一體化。數據應用平臺包括數據智能分析模塊,提供有效的數據分析工具,滿足靈活性、安全性和便利性。

數據應用實施

完成面向大數據平臺的數據血緣關係梳理。重構大數據平臺中間層(200 張表)數據模型,併進行落標實施。根據數據質量檢核規則,在數據平臺上對源頭數據和結果數據進 行規則稽核。

結合營銷與風控應用場景,完成至少200個基礎指標加工。提供不少於 5 個建模場景要求的數據支持和不少5個應用場景的功能支持(開展數據自主分析、開發報表和管理駕駛艙等)。

銀行機構數據治理建設成果

數據治理成果

一是數據治理戰略目標,治理頂層設計、治理目標、治理運營、治理成果等數據治理相關的戰略規劃設計材料。

二是治理組織及規章,設計某銀行數據治理組織架構,並根據數據治理目標定製相關的規章制度來保障治理落地。

三是治理實現路徑,明確某銀行數據治理工作的實施路徑,細化數據治理工作的關鍵步驟並交付相關文件給某銀行。

四是治理考核及運營,結合某銀行數字化考核目標制定數據治理考核方案,並提供數據治理支持運營及優化的方法論材料。

五是數據資產目錄,梳理某銀行業務系統、數據倉庫的數據資源,完善數據各項屬性元數據,構建全行級數據資產目錄

六是數據標準體系,梳理某銀行現有的數據內容,搭建圍繞基礎類數據和指標類數據兩大標準體系,並完成歷史數據落標工作。

七是分級分類體系,按照人行數據分級分類指南相關規劃構建某銀行數據分級體系,並完成歷史數據的分級分類工作。

八是數據治理體系,圍繞人行、銀保監數據報送校驗規則結合某銀行數據加工過程校驗規則,構建全行級數據質量監控規則體系。

平臺實施成果

一是大數據平臺血緣解析,某銀行ImpalaSQL的ETL任務進行數據血緣解析,包括表血緣、欄位血緣等信息,同時藉助袋鼠雲數據平臺實現跨系統數據交換的血緣關係。

二是數據質量規則體系搭建,圍繞銀保監East4.0/5.0數據質量規範,構建監管數據檢核規則,包括監管報表單體校驗、跨系統數據校驗(1104與East)、溯源數據質量檢驗等信息。同時,根據人行反洗錢監管要求構建交易對手信息檢核滿足人行反洗錢檢查要求。

三是大數據模型重構,根據某銀行項目要求重構大數據平臺中間層(近200 張表)數據模型,通過數據模型平臺進行模型設計、模型建標和模型落標,並通過行內現有數據進行模型驗證。

四是指標體系設計及搭建,結合某銀行在信貸營銷與風控領域的應用場景調研指標體系,並針對業務實際需求完成至少200個基礎指標加工及複雜衍生指標搭建;梳理數據資產(包括核心、信貸、 網貸等至少10個系統)並搭建數據資產目錄;根據監管及內部管理需求梳理數據標準體系並通過平臺落地;圍繞人行金融數據分級分類規範搭建某銀行數據分級體系並結合銀保監數據加密規範實現數據安全保障體系

五是數據分析場景服務,根據某銀行應用需求提供不少於 5個建模場景要求的數據支持和不少於 5 個應用場景的功能支持開展數據自主分析、開發報表和管理駕駛艙等。

《數棧產品白皮書》:https://www.dtstack.com/resources/1004?src=szsm

《數據治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm

想瞭解或咨詢更多有關袋鼠雲大數據產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky

同時,歡迎對大數據開源項目有興趣的同學加入「袋鼠雲開源框架釘釘技術qun」,交流最新開源技術信息,qun號碼:30537511,項目地址:https://github.com/DTStack


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • # Auto.Core (基於AspectCore) ![logo.png](https://github.com/zhangxianchengvip/auto/blob/main/logo/logo.png?raw=true) #### 介紹 **[Auto.Core](https://githu ...
  • ## 一:背景 ### 1. 講故事 前幾天有位朋友找到我,說他們公司的後端服務記憶體暴漲,而且CPU的一個核也被打滿,讓我幫忙看下怎麼回事,一般來說記憶體暴漲的問題都比較好解決,就讓朋友抓一個 dump 丟過來,接下來我們用 WinDbg 一探究竟。 ## 二:WinDbg 分析 ### 1. 到底是 ...
  • ## 引言 在C#中,讓線程同步有兩種方式: - 鎖(lock、Monitor) - 信號量(EventWaitHandle、Semaphore、Mutex) 線程鎖的原理,就是鎖住一個資源,使得應用程式在此刻只有一個線程訪問該資源。通俗地講,就是讓多線程變成單線程。在C#中,可以將被鎖定的資源理解 ...
  • # Linux下chkconfig命令詳解(service) ## 一、釋義 ```markdown chkconfig命令主要用來更新(啟動或停止)和查詢系統服務的運行級信息。謹記chkconfig不是立即自動禁止或激活一個服務,它只是簡單的改變了符號連接。 ``` ## 二、使用語法 ```sh ...
  • 文件系統內部的inode(Index Node)是為瞭解決文件管理和數據存儲的問題,並提供了一些重要的用途,包括: 1. 文件索引:inode是文件系統中的一個數據結構,它存儲了文件的元數據,如文件名、文件大小、文件許可權、文件所有者等信息。inode相當於一個文件的索引,通過它可以快速定位和管理文件 ...
  • 符號鏈接和硬鏈接是兩種不同的鏈接方式,它們有以下區別: 文件系統支持:符號鏈接是由文件系統直接支持的,而硬鏈接是由文件系統內部的inode支持的。 跨文件系統:符號鏈接可以跨越不同的文件系統,可以鏈接到其他磁碟分區或網路共用。而硬鏈接只能在同一個文件系統中創建鏈接。 鏈接目標:符號鏈接可以鏈接到文件 ...
  • 由於部署個人項目使用了`openjdk11`,但是我之前安裝的是`jdk1.8`,jdk版本升級的後果就是,tomcat運行的時候報一點小bug,找了很多資料之後,決定在tomcat的運行文件中覆蓋使用的jdk版本路徑來解決 ...
  • 以分號結尾加回車為一個命令 show databases;//展示所有資料庫 create database xxx;//創建新的資料庫 create database if not exists xxx;//檢查是否創建XXX資料庫,沒有則創建,有則不創建 create database defa ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...