證券機構數據治理實踐,實現數據的“管、 治、用”

来源:https://www.cnblogs.com/DTinsight/archive/2023/08/01/17597541.html
-Advertisement-
Play Games

2016年證監會《證券公司全面風險管理規範》提出建立健全[數據治理](https://www.dtstack.com/?src=szsm)和質量控制機制。 2018年證監會發佈《證券數據治理操作指引(征求意見稿)》及《證券期貨業數據分類分級指引》。同年,國家工信部發佈[DCMM數據管理能力成熟度評估 ...


2016年證監會《證券公司全面風險管理規範》提出建立健全數據治理和質量控制機制。

2018年證監會發佈《證券數據治理操作指引(征求意見稿)》及《證券期貨業數據分類分級指引》。同年,國家工信部發佈DCMM數據管理能力成熟度評估模型,提煉組織數據管理的八大過程域,將數據能力成熟度劃分5個發展等級,幫助進行評價。

2022年,《證券期貨業科技發展“十四五”規劃》《金融標準化“十四五”發展規劃》的相繼發佈,以夯實證券期貨業通用基礎標準體系,促進證券期貨業數字化轉型與標準化的深度融合,為證券期貨業高質量發展提供更多助力。標準化對數字化轉型的引領和推動作用日益顯現。

但許多證券機構在推進數據治理的過程中,仍然存在數據治理驅動力不足、缺少數據治理體系規劃、數據認責體系不完善、數據質量難提升等諸多問題,數據治理亟須快速提升。

為充分發揮數據的資產價值,通過梳理證券期貨行業監管大數據治理的需求與特殊性,對證券期貨行業的大數據治理體系搭建,包括構建證券期貨行業數據模型、搭建公共數據平臺、建設數據服務體系以及構建組織保障體系等方面。

證券機構數據治理解決方案

基於DataOps體繫數據治理新範式

DataOps從環境管理開始,每個環境下都可以支持任務的編排、監控和自動化測試。每次進行跨環境的發佈時,記錄每次發佈代碼的版本,進行後期排查問題。在發佈上線至生產後,袋鼠雲的數據中台產品可將券商用戶上述各個環節串聯起來,券商用戶從開發階段可以一鍵發佈至測試環境,經測試環境驗證後,觀察任務實例、數據產出的運行情況,運行無誤後可發佈至生產環境。

如下圖所示,資訊、交易、風控等主題的數據從左側的源系統流入,中間環節是各類數據處理的工具,例如數據倉庫或數據集市、AI分析等,數據經過清洗、加工、彙總統計、數據治理等過程,最終通過BI、定製化報表、API等工具服務於投研、營銷、經營分析等各類需求方。
file

基於SDOM模型高效數倉搭建與治理

通過梳理市場證券、基金、期貨、債券、回購等主要交易行為,形成行業交易模式;通過逆向梳理即將上線和線上化的信息披露項目,形成行業信息披露模式。根據證券行業相關法律法規、業務規則、制度及流程等,提取市場全業務流程和數據共性,形成具有通用性、穩定性和可擴展性的圍繞客戶、公司、監管、產品、交易等數據模型。
file

基於OLAP的資訊數據校驗

資訊數據作為券商主要數據源之一,應用廣泛,涉及投資交易、資產管理、經紀與財富管理、資產托管等各個領域,往往會將資訊數據應用到資管投研一體化、投資交易、資產托管、融資融券等系統。同時由於業務的需求,往往需要從市面上採購多種異構數據源介面,例如Wind、聚源、財聯、通聯、港澳資訊等,有的券商甚至採購多達二三十種的資訊數據。

這些資訊面臨以下問題:一是數據質量參差不齊,數據問題難以及時發現,頻繁收到業務方的投訴:二是數據質量管理成本大,規則開發難度高:三是問題排查鏈路長,難以快速定位數據問題,缺乏全局統計視角:四是質量問題沒有經驗沉澱,類似問題頻繁發生。

對於各種資訊數據,進行跨源比對,在源頭進行落標、治標的工作。通過事前規則配置、事中規則校驗、事後分析報告的流程化方式,對數據的完整性、準確性、規範性、唯一性、一致性等方面進行多維度評估,保障券商數據質量。
file

基於數據模型的標簽數據治理

金融科技的快速發展,使得證券行業的載體與社交媒體、電子商務的融合越來越緊密,券商藉助數據戰略打破數據邊界,來構建更為全面的企業營銷全景視圖。面對客戶活動開發周期長,運營不精準,營銷效果缺乏及時追蹤、運行反饋不及時,通過袋鼠雲客戶數據洞察平臺,業務人員可透明化地使用標簽,將數據黑盒變成業務語言的白盒,輔助業務決策,驅動業務增長。使用場景包括網路金融部的營銷運營、異常交易監控及用戶生命周期管理等。
file

基於OneService理念打造數據服務市場

數據平臺將投研、資訊、投顧數據以服務化、介面化的方式提供數據使用方,屏蔽底層數據存儲、計算細節,簡化和加強數據的使用。可視化生成與註冊數據服務管理,快速構建數據共用服務,通過多種手段標準化管控服務,可完成從數據介面創建、發佈、申請/審批、調用的全生命周期管控,形成數據市場和數據服務管理平臺,提高數據開發與共用效率。
file

證券機構數據治理交付內容

數據平臺建設

數據平臺包含數據實時開發平臺和數據應用平臺,實現數據的“管、 治、用”。

一是構建大數據實時開發平臺,覆蓋從實時數據採集到實時數據開發全鏈路流程,並提供運維監控曲線和日誌功能。具體功能如下:

1)實時採集,具備基於日誌的實時數據採集和基於間隔輪詢的實時數據採集方式,具有通過採集資料庫的變化併進行還原的方式,將資料庫靜態的數據插入、更新、刪除的動作轉換為消息中間件的動態數據變化,或直接寫入到Hive進行數據落庫。

2)任務管理,平臺應支持對實時同步任務的統一管理,支持FlinkSQL和Flink API作業開發支持,支持環境參數配置,歷史版本管理等內容。

3)資源管理,平臺支持對實時開發過程中所使用的資源進行統一管理,支持用戶上傳本地jar資源,註冊自定義函數等操作,並可實現對資源進行多版本管理。

4)函數管理,平臺集成開發過程中的常用函數,同時平臺支持通過本地資源創建UDF、UDAF、UDTF函數,創建完成後用戶可通過函數名稱使用對應函數,也可以通過修改對應的資源文件,修改完成後重新提交任務即可實現在不修改代碼的情況下實現函數更新。

二是構建數據應用平臺,這裡主要為數據服務平臺,這是數據中臺中最頂層的組成部分,是數據能力對外提供的介面層,通過數據服務平臺賦能前端應用,是數據能力的出口。通過數據服務平臺的建設,對數據能力進行抽象封裝,系統實現以下目標:

1)封裝數據能力,對外提供RESTful介面。應用通過調用RESTful服務即可獲取數據內容,應用程式無需瞭解表結構、分庫分表等細節信息。

2)橫向擴展能力支持高併發和數據增長。通過增加存儲節點支持數據量的增長,通過增加服務處理節點支持高併發。

3)配置化創建數據服務。開發人員可以基於底層的資料庫,在管理界面配置SQL數據查詢語句、參數、資料庫連接、許可權等內容,即可創建發佈一個新的數據服務
file

數據服務平臺的建設,將帶來以下效益:

1)減少數據複製,降低成本。應用系統無需拷貝數據內容,通過服務調用獲取數據,從而降低數據存儲成本,特別是包含歷史數據查詢的應用場景。同時,降低備份、安全等管理成本。

2)提升應用開發效率。應用程式無需考慮大數據的分庫分表設計、無需瞭解底層的數據存儲細節,通過服務調用即可獲得返回結果。大大避免數據不一致的衝突。由於同樣數據無需管理多個副本,在數據發生變更時,無需複製更新,減少數據不一致的衝突。

數據應用實施

完成面向大數據平臺的數據血緣關係梳理。重構大數據平臺合約、賬戶資金、持倉、特殊證券場景數據模型,併進行落標實施。完成兩融客戶資產負債實時統計推送、財務憑證流水實時統計推送、原生Flink作業SQL數倉化改造。

銀行機構數據治理建設成果

海量業務數據匯聚,構建金融級數據平臺

大數據引擎+流批一體數據採集滿足證券公司業務系統的數據匯聚,對線上和線下業務數據進行採集匯聚,提供集中的大數據技術和存儲能力,保障實時多樣化數據採集、數據存儲、數據計算;提供強大的大數據平臺基礎,滿足現在和未來的數據採集、存儲和技術需求。

統一數據開發,降低大數據開發門檻

實時開發平臺滿足證券公司科技部門能統一在一個平臺上進行集中開發和對內外各種租戶數據加工,提供統一一體化數據開發平臺,滿足大數據、SQL、圖形化各種數據開發加工要求,降低開發工具的複雜度、數據開發成本,快速構建數據倉庫。

滿足監管報送,實現一體化數據服務

數據服務平臺,提供對內的統一數據服務和數據交換,滿足金融第三方機構的監管報送要求,證券公司提供標準化的數據報送服務出口,對外能滿足第三方監管報送的數據服務方式和數據使用要求。

數據分析場景服務

根據某證券公司應用需求,袋鼠雲為其設計了以下三種數據分析場景服務

一是客戶辦理的兩融業務進行信用賬戶資產負債實時計算:

1)實時獲取櫃臺行情數據,並按照分鐘級進行行情聚合。

2)實時獲取客戶的股票持倉數據,並將客戶持倉數據按照狀態進行管理並動態更新,同時按照客戶持倉股票代碼和分鐘級行情進行關聯實時計算客戶總持倉資產。

3)實時獲取兩融客戶合約流數據,根據合約類型分類計算融資負債、融券負債。按照客戶融券合約股票代碼和分鐘級股票行情進行關聯,實時動態計算並更新客戶融券負債。

4)實時獲取客戶資金轉入數據,並更新客戶的總資金資產和可用資金。

5)實時獲取客戶的融券賣出獲得資金以及資金使用情況並動態更新客戶資產負債表。並計算持倉集中度、分組持倉市值、高風險證券持倉市值、跌破下限價證券持倉市值等指標。

6)通過多流關聯的方式整合持倉、合約、資金轉入、融券交易的數據最終輸出客戶資產負債表。

7)實時獲取客戶兩融授信申請、客戶徵信申請、客戶徵信審批等數據,實時監控客戶的授信申請額度、授信狀態、徵信審批狀態、審批額度等變化,推送到下游系統。

二是實時獲取財務憑證流水:關聯輔助核算維表(維表也存在日間變動的可能),根據財務指標計算規則,按照部門、科目維度計算財務指標日間變動數據並推送到下游。

三是原生FLink服務缺少監控,為增強運維監控工作,擬將以下數據遷移到實時平臺:

1)當日股基交易量、當日理財交易量

2)當日開戶數和開戶流水

3)可轉債提前贖回提醒

4)中證易簽私募回訪:生成回訪任務提醒、回訪任務成功提醒

《數棧產品白皮書》:https://www.dtstack.com/resources/1004?src=szsm

《數據治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm

想瞭解或咨詢更多有關袋鼠雲大數據產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky

同時,歡迎對大數據開源項目有興趣的同學加入「袋鼠雲開源框架釘釘技術qun」,交流最新開源技術信息,qun號碼:30537511,項目地址:https://github.com/DTStack


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ## 引言 現在模擬一個非同步方法拋出了異常: ```csharp public static async Task ThrowAfter(int ms, string message) { await Task.Delay(ms); throw new Exception(message); } ` ...
  • 一、TextBox在輸入框回車時會觸發其他事件,如何解決? 前臺代碼: <ul> <li><span>名稱:</span><asp:TextBox ID="txtCategoryName" runat="server" CssClass="forminput form-control"></asp: ...
  • ASP.NET Core WebAPI如何獲得遠程文件返迴文件流給前端?項目採用的是前後端分離的模式,後端使用ASP.NET Core WebAPI方式,將文件流返回給前端。 ...
  • Repeater 控制項用於顯示被綁定在該控制項上的項目的重覆列表。Repeater 控制項可被綁定到資料庫表、XML 文件或者其他項目列表。 GridView 控制項,通過使用 GridView 控制項,您可以顯示、編輯和刪除多種不同的數據源(例如資料庫、XML 文件和公開數據的業務對象)中的數據。 ...
  • 博客推行版本更新,成果積累制度,已經寫過的博客還會再次更新,不斷地琢磨,高質量高數量都是要追求的,工匠精神是學習必不可少的精神。因此,大家有何建議歡迎在評論區踴躍發言,你們的支持是我最大的動力,你們敢投,我就敢肝 ...
  • # 當我們想要體驗體驗不同類型的Linux的使用技巧,節省個人開銷,可以在Windows系統上創建其他系統的虛擬機,可以創建虛擬機常用的應用有: VMware Station VirtualBox 此篇文章使用VirtualBox,結合Vagrant來實現Linux虛擬機的創建。使用這兩種應用結合的 ...
  • ### 企業現狀 **目前絕大多數企業運維人員的工作環境都是Windows下通過SSH工具(如XShell等)遠程連接千百裡外的伺服器進行管理和維護的。** 而且學Linux運維,99.9%知識與硬體無關,用虛擬機足矣。 08年以前沒有虛擬化概念。買伺服器,放機房。 > 類似點蠟燭 **現在80%中 ...
  • ![](https://img2023.cnblogs.com/blog/3076680/202308/3076680-20230801154428674-66504638.png) # 1. 分組 ## 1.1. 把相似的行數據聚集在一起 # 2. SQL分組的定義 ## 2.1. 數學上的“群” ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...