一個平臺搞定數據治理,讓數據資產發揮價值

来源:https://www.cnblogs.com/DTinsight/archive/2023/11/01/17802462.html
-Advertisement-
Play Games

根據北京研精畢智信息咨詢發佈的調查報告,2018-2021年,全球數據存儲量由30ZB上升至55ZB左右,年平均增長率約為27.8%。到2022年,數據總存儲量進一步增加至65ZB以上,較2021年同期新增了約10ZB,同比增長18.2%。各市場主體對數據的重視程度不斷提升,數據應用逐步由批量處理向 ...


根據北京研精畢智信息咨詢發佈的調查報告,2018-2021年,全球數據存儲量由30ZB上升至55ZB左右,年平均增長率約為27.8%。到2022年,數據總存儲量進一步增加至65ZB以上,較2021年同期新增了約10ZB,同比增長18.2%。各市場主體對數據的重視程度不斷提升,數據應用逐步由批量處理向規模化存儲的方向發展。

隨著各行各業數字化轉型的深入,數據體量爆炸式增長。如何控制數據生產成本、發現有價值的數據,提高數據ROI,成了企業數字化轉型中後期的關鍵任務。

本文將為大家解析如何通過企業數據多維度治理,實現數據資產的最大化利用和價值發揮。

為什麼要做數據治理?

“降本增效”無疑是2023年的關鍵詞,無論是各行業巨頭還是中小企業,都在試圖通過持續的降本增效保持競爭優勢。而數據治理正是其中的關鍵一環。

控制生產成本

在數倉建設過程中,企業往往更關心數據的產生和交付,對於數據的治理沒有引起足夠的重視。當存在資源不足、成本攀高的情況時,無法明確優化成本的方向。對於大量的沉默數據存儲如何處理,冗餘的數據計算資源如何分配,也沒有針對性的措施。

數據治理的目的正在於快速識別和解決那些導致企業數據成本增加或數據質量下降的惡性因素,幫助企業降低數據成本,提高數據質量和可靠性,更好地支持業務決策和持續發展。

提高數據價值

數據資產可以幫助用戶建立數據標準、規範數據模型、輔助企業進行數據質量校驗,但同時也存在管理推動難、下層執行難等問題。如何有效識別價值數據、保留價值數據、推動價值數據落地是企業必須要考慮的一點。

數據治理可以幫助企業全面瞭解和掌握具有重要價值的數據,推動數據標準的落地實施,確保數據的準確性和一致性,提高數據質量。

file

如何實現數據治理?

國際數據管理協會在其《DAMA 數據管理知識體系指南》一書中,將數據治理作為數據管理十大知識領域的中心,負責知識領域的平衡和一致性,為各項數據管理活動提供總體指導策略。

file

如今,數據治理的重要性已不言而喻,然而大部分企業對於數據治理還有著一個普遍的共識,那就是:“數據治理說起來容易,做起來難!”

數據治理究竟應該怎麼治?在哪裡治?

制定數據治理規則

數據治理規則可從計算、存儲、質量、規範、價值五個維度進行配置,通過制定不同維度的治理規則,幫助企業優化存儲成本、避免資源浪費、提升數據質量、推動標準規範,實現數據價值。

● 計算維度

以每個項目的任務為基礎進行超長任務判斷、異常情況判斷,定義不同規則對應的建議處理方式,避免資源浪費。

file

● 存儲維度

以每個項目的數據表為基礎進行,定義不同規則對應的建議處理方式,優化存儲成本。

file

● 質量維度

以每個項目的任務為基礎進行,定義不同規則對應的建議處理方式,提升數據質量。

file

● 規範維度

以每個項目的數據表為基礎進行,定義不同規則對應的建議處理方式,推動標準規範落地。

file

● 價值維度

以每個項目的數據表為基礎進行,定義不同規則對應的建議處理方式,幫助企業瞭解數據使用情況,提升數據價值。

file

搭建數據治理工作台

數據治理實踐實施過程中,需要依托具體的平臺來執行。隨著技術的不斷發展,這些平臺的智能化程度也在不斷提高。

袋鼠雲數據治理中心支持搭建數據治理工作台,工作台可發起治理任務,並展示待處理的問題,處理方式建議,處理責任人及進展等,實現數據治理問題處理流程閉環,對數據治理過程的全生命周期進行管理。

● 建立個人工作台

個人工作台針對每個用戶,展示具體用戶的待處理問題列表。每個用戶可查看分配給自己的問題處理清單,查看目前待處理問題總數、已處理問題數、已延期問題數、加入白名單問題數等。

進行問題處理後系統會自動對該問題進行復驗,驗證無誤後該問題會變為“已處理”狀態;驗證有問題需再次進行處理,完成治理問題處理閉環管理。

file

● 治理任務配置

治理任務管理支持以項目維度進行治理任務管理,可配置治理任務的調度周期、治理通知信息,能夠查看每個治理項目的產生問題總數、待處理問題數、待分配問題數。

file

治理項處理可查看未分配的問題清單,可按照不同維度,不同的問題類別進行處理人的批量指派,指派問題時可設置該問題的處理時效(例如需要在3天內處理完成,若未完成記錄為延期處理問題數量),通知方式等。

file

● 治理成果全景概覽

數據治理成果總覽支持以全景視圖、項目視圖、個人視圖等多個視圖維度彙總展示治理概況,展示內容包含項目數量、任務數量、數據表數、待治理項數、資產健康分、分值變化趨勢、治理項變化趨勢等內容,便於企業全方位瞭解治理概況。

file

數據治理的價值

通過實施數據治理,企業可以對其數據收集、整合、清洗和處理等過程進行有效的管理和控制,以確保持續生成高質量的數據。這些經過治理的數據為企業提供了更明智的決策依據,所有這些舉措都將進一步推動企業的業務發展和創新管理。

袋鼠雲數據治理中心可持續監控平臺使用過程中數據存儲、任務計算、代碼開發、數據質量、數據規範、數據價值等維度存在的問題,並通過資產健康分的量化評估,從全局、項目、個人多個視圖角度呈現治理成果。

推動企業完善數據規範、優化數據質量、節約資源、降本增效,幫助企業高效達成治理目標,讓數據資產發揮價值。

我們將過往經驗彙集成冊,編寫了一本《數據治理行業實踐白皮書》,140頁深度乾貨,囊括15個典型成功案例,全書從方法論到實踐全面解碼數據治理,開闢數據治理新範式。豐富內容可免費下載,對數據治理感興趣的同學一定要看!

file

《數據治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm

《數棧產品白皮書》:https://www.dtstack.com/resources/1004?src=szsm

想瞭解或咨詢更多有關袋鼠雲大數據產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky

同時,歡迎對大數據開源項目有興趣的同學加入「袋鼠雲開源框架釘釘技術qun」,交流最新開源技術信息,qun號碼:30537511,項目地址:https://github.com/DTStack


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • TerraMoursGPT V1.0 開發總結 TerraMoursGPT V1.0 是之前gpt項目基於TerraMours後端框架的重構,實現用戶登陸和基於SK的多語言模型聊天、基於chatgpt和SD的多模型圖片生成等功能。管理端實現數據看板、聊天記錄管理,圖片記錄管理、用戶管理、系統配置等。 ...
  • VPN介紹 VPN(Virtual Private Network)虛擬專用網路,是一種加密技術,用於再公共網路上建立一條安全的通道實現數據的傳輸。VPN的原理就是將數據進行加密,從而在不安全的網路上安全傳輸。 實現VPN的技術有很多,例如PPTP、IPsec、SSL\TLS。使用不同的技術,加密的 ...
  • Awk實戰案例精講 插入幾個新欄位 在"a b c d"的b後面插入3個欄位e f g。 echo a b c d|awk '{$3="e f g "$3}1' 格式化空白 移除每行的首碼、尾碼空白,並將各部分左對齊。 aaaa bbb ccc bbb aaa ccc ddd fff eee gg ...
  • 安裝新版本gawk awk有很多種版本,例如nawk、gawk。gawk是GNU awk,它的功能很豐富。 本教程採用的是gawk 4.2.0版本,4.2.0版本的gawk是一個比較大的改版,新支持的一些特性非常好用,而在低於4.2.0版本時這些語法可能會報錯。所以,請先安裝4.2.0版本或更高版本 ...
  • wget wget是一個流行的、免費的、非互動式的命令行工具,主要用於從網路上下載文件。支持通過HTTP、HTTPS和FTP協議下載,並且它是遞歸下載的,這意味著它可以鏡像網站或獲取完整的FTP目錄結構。 下載單個文件 使用wget時,只指定了url地址,表示從網路中下載單個文件到當前目錄,這是wg ...
  • 認識Redis Redis官網:https://redis.io/ Redis誕生於2009年全稱是Remote Dictionary Server 遠程詞典伺服器,是一個基於記憶體的鍵值型NoSQL資料庫 特征: 鍵值(key-value)型,value支持多種不同數據結構,功能豐富 單線程,每個命 ...
  • 10月30日,“速智未來 鷺島展翼”雲智超一體化算力推動數字廈門新跨越系列活動在福建廈門成功舉辦。省市政府部門領導、中國電信福建公司領導、各合作伙伴企業代表與天翼雲共聚一堂,活動現場舉行“速智未來 鷺島展翼”主題展、廈門市與天翼雲項目及福建電信戰略合作簽約儀式、“天翼雲杯”廈門算力應用大賽賽題徵集等... ...
  • 隨著大數據時代的到來,數據作為重要的生產要素和流動載體,如何加強技術層面的數據安全和隱私保護,對數據倉庫產品提出更高的要求。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...