數據倉庫(12)數據治理之數倉數據管理實踐心得

来源:https://www.cnblogs.com/the-pig-of-zf/archive/2022/05/11/16259912.html
-Advertisement-
Play Games

這邊文章聊聊自己對數據治理開發實踐的一些思路,就是聊聊怎麼開始去做數據治理這件事情。說起數據治理,有時候雖然看了很多文章,看了很多的介紹,瞭解數據治理的理論,但是實際上需要我們去搞的時候,就會踩很多的坑。這裡記一下自己做數據治理的一些思路,做做筆記,也分享給需要的同學。 當然,想要做數據治理,想要學 ...


這邊文章聊聊自己對數據治理開發實踐的一些思路,就是聊聊怎麼開始去做數據治理這件事情。說起數據治理,有時候雖然看了很多文章,看了很多的介紹,瞭解數據治理的理論,但是實際上需要我們去搞的時候,就會踩很多的坑。這裡記一下自己做數據治理的一些思路,做做筆記,也分享給需要的同學。

當然,想要做數據治理,想要學習瞭解,一下數據治理的範圍,理論等,最好可以看看別人怎麼做的,瞭解數據治理可以參考:數據倉庫(11)什麼是大數據治理,數據治理的範圍是哪些

那接下來就繼續說說數據治理的一些思路心得。

接到數據治理的任務?要怎麼做?

  • 梳理目前數據集群,以及業務的總體情況

這個,其實沒有什麼好說,做事情之前,肯定是要先瞭解,我們要做的東西是怎麼樣的,評估可能會遇到的問題,這樣才能進一步做出來好的數據質量方案。

  • 對數據治理進行分類

瞭解了我們面對的數據集群之後,就要瞭解對我們需要治理的方向,進行分類了,這個對我們後續的方案設計和組件的選取、改造會有很大的影響,不一樣的分類,我們要解決問題的範圍,是不一樣的。

那要怎麼分類?首先是大的方向。

  1. 主數據管理
  2. 元數據管理
  3. 數據標準
  4. 數據質量管理
  5. 數據安全管理
  6. 數據計算管理
  7. 數據存儲管理

大的方向確定了,當其實還是太大了,還是需要進一步的進行切割。

像是數據質量管理,可以進一步切分為

1 唯一性校驗:不存在無意義的重覆數據
2 完整性校驗:數據完整且連續
3 一致性校驗:數據在多數據源中意義一致
4 有效性校驗:這裡主要指數據在分析的時間點是有效,而非過期或失效數據
5 準確性校驗:數據合理、準確,並符合數據類型的標準

元數據管理,要劃分為技術元數據和業務元數據等,具體的劃分粒度,應該需要到具體的,可實現的,不容易混淆,以及偏於以後數據的管理和使用。畢竟這個東西後續要給開發,給數據bi等人使用的。當然,我們可能不能已下載就劃分好一個最好的分類,我們應該迴圈迭代,做出一個更加符合實際出來。

數據管理這個,如果說技術能力,開發人力有限,那其實往往更加簡單的方式更好,也便於推廣,應該說一個可用的方案好過於一個全面,但用起來不方便的方案。

  • 針對某個類別的數據,進行具體設計,開發,併進一步成規範

上面,我們已經大概梳理好了我們數據治理的範圍和分類,進一步的,我們就需要落地了。這個時候,我們就要進一步的針對,我們的劃分的問題,提出,我們的方案,並實現他。

如果,上面說的數據質量管理中的準確性校驗,這個時候,我們就面臨了一個問題,怎麼樣的數據,符合數據合理、準確,並符合數據類型的標準這樣的數據規範?我們會怎麼去驗證這個東西呢?正常情況下,開發人員是怎麼去驗證這個東西的?

所以,這個時候,我們就需要抽象出這些具體的操作,拼通過合適的方案實現他。

如果,準確性校驗,開發人員一般是通過寫sql,通過一定的數據規則判斷的,比如數據的波動,數據值的範圍等。那麼我們做這個的時候,是不是就可以做這樣的一個系統,可以配置sql,或者一些比較通過的邏輯,定時比對數據,得到我們的一個結果,實現這樣的一個功能?當然這個肯定不是最好的方案,但是一個可用的方案好過於一個全面,但用起來不方便的方案。然後不停的迭代優化,完善。

當然,這個時候也要放過來思考我們上面的劃分是不是,合理,比如數據質量管理,是不是可以使用同一個思路去做?爭取事半功倍。

  • 執行規範

做好上面的事情,接下來,就是考驗執行了的時候了,任何方案在,最終如果不能很好的執行,那就是事倍功半。

啰里啰唆,寫了這一點點心得,邏輯可能不是很通暢,希望可以給到各個在數據治理掙扎的同學,一點思路,這個也是我的個人筆記,後續有新的想法,再更新。

參考資料:數據倉庫(12)數據治理之數倉數據管理實踐心得

本文來自博客園,作者:張飛的豬,轉載請註明原文鏈接:https://www.cnblogs.com/the-pig-of-zf/p/16259912.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • rpm資源包下載 在一些內網或區域網環境中,無法通過 yum install xxx 進行程式包的下載安裝。 需要從具有外網環境的電腦上下載離線程式包,拷貝至內網環境中手動安裝。 方法一:使用 yum 下載 yum --downloadonly --downloaddir=/home/package ...
  • 1.第一個shell vi first.sh !/bin/bash 作者:Arya 編寫時間:2022-04-22 功能:this is my first blog! echo "this is my first shell!" 2.crond服務 以守護進程方式在無需人工干預的情況下來處理著一系列 ...
  • https://www.cnblogs.com/yeungchie/ XFCE是一款輕量級 Linux 桌面,當前版本已經將所有部件從 GTK2 更新到 GTK3,從D-Dbus Glib更新到GDBus,大部分組件支持Object Introspection(簡稱 GI,用於產生與解析 C 程式庫 ...
  • 為什麼要使用Docusaurus Docusaurus 是 Facebook 專門為開源項目開發者提供的一款易於維護的靜態網站創建工具,使用 Markdown 即可更新網站。構建一個帶有主頁、文檔、API、幫助以及博客頁面的靜態網站,只需5分鐘。 Docusaurus 是一個靜態站點生成器。它構建了 ...
  • cat命令詳解 用法 功能 cat filename 獲取文件內容 cat file1 file2 > newfile 將file2的內容追加到file1,生成新文件newfile,但不會刪除原文件 cat > file 創建並編輯file,若file存在,則原文件內容被覆蓋, 按ctrl c 或者 ...
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 第一次在Linux雲伺服器上部署前後端分離項目,查了很多資料和視頻,踩了許多坑。成功實現部署若依的前後端分離項目後,想記錄一下前後端部署的過程,供學習的小伙伴參考。 1.環境準備 一定要在開始前先準備好以下工具和環境(可以上網查找安裝的方法),後 ...
  • 引言 我們在定時任務中經常能接觸到cron表達式,但是在寫cron表達式的時候我們會遇到各種各樣版本的cron表達式,比如我遇到過5位、6位甚至7位的cron表達式,導致我一度搞混這些表達式。更嚴重的是,當我們沒有準確寫出cron表達式時,會出現定時任務一直沒有執行,或者定時任務執行太頻繁的糟糕情況 ...
  • 一、Flink中的狀態 官方文檔 有狀態的計算是流處理框架要實現的重要功能,因為稍複雜的流處理場景都需要記錄狀態,然後在新流入數據的基礎上不斷更新狀態。下麵的幾個場景都需要使用流處理的狀態功能: 數據流中的數據有重覆,想對重覆數據去重,需要記錄哪些數據已經流入過應用,當新數據流入時,根據已流入過的數 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 微服務架構已經成為搭建高效、可擴展系統的關鍵技術之一,然而,現有許多微服務框架往往過於複雜,使得我們普通開發者難以快速上手並體驗到微服務帶了的便利。為瞭解決這一問題,於是作者精心打造了一款最接地氣的 .NET 微服務框架,幫助我們輕鬆構建和管理微服務應用。 本框架不僅支持 Consul 服務註 ...
  • 先看一下效果吧: 如果不會寫動畫或者懶得寫動畫,就直接交給Blend來做吧; 其實Blend操作起來很簡單,有點類似於在操作PS,我們只需要設置關鍵幀,滑鼠點來點去就可以了,Blend會自動幫我們生成我們想要的動畫效果. 第一步:要創建一個空的WPF項目 第二步:右鍵我們的項目,在最下方有一個,在B ...
  • Prism:框架介紹與安裝 什麼是Prism? Prism是一個用於在 WPF、Xamarin Form、Uno 平臺和 WinUI 中構建鬆散耦合、可維護和可測試的 XAML 應用程式框架 Github https://github.com/PrismLibrary/Prism NuGet htt ...
  • 在WPF中,屏幕上的所有內容,都是通過畫筆(Brush)畫上去的。如按鈕的背景色,邊框,文本框的前景和形狀填充。藉助畫筆,可以繪製頁面上的所有UI對象。不同畫筆具有不同類型的輸出( 如:某些畫筆使用純色繪製區域,其他畫筆使用漸變、圖案、圖像或繪圖)。 ...
  • 前言 嗨,大家好!推薦一個基於 .NET 8 的高併發微服務電商系統,涵蓋了商品、訂單、會員、服務、財務等50多種實用功能。 項目不僅使用了 .NET 8 的最新特性,還集成了AutoFac、DotLiquid、HangFire、Nlog、Jwt、LayUIAdmin、SqlSugar、MySQL、 ...
  • 本文主要介紹攝像頭(相機)如何採集數據,用於類似攝像頭本地顯示軟體,以及流媒體數據傳輸場景如傳屏、視訊會議等。 攝像頭採集有多種方案,如AForge.NET、WPFMediaKit、OpenCvSharp、EmguCv、DirectShow.NET、MediaCaptre(UWP),網上一些文章以及 ...
  • 前言 Seal-Report 是一款.NET 開源報表工具,擁有 1.4K Star。它提供了一個完整的框架,使用 C# 編寫,最新的版本採用的是 .NET 8.0 。 它能夠高效地從各種資料庫或 NoSQL 數據源生成日常報表,並支持執行複雜的報表任務。 其簡單易用的安裝過程和直觀的設計界面,我們 ...
  • 背景需求: 系統需要對接到XXX官方的API,但因此官方對接以及管理都十分嚴格。而本人部門的系統中包含諸多子系統,系統間為了穩定,程式間多數固定Token+特殊驗證進行調用,且後期還要提供給其他兄弟部門系統共同調用。 原則上:每套系統都必須單獨接入到官方,但官方的接入複雜,還要官方指定機構認證的證書 ...
  • 本文介紹下電腦設備關機的情況下如何通過網路喚醒設備,之前電源S狀態 電腦Power電源狀態- 唐宋元明清2188 - 博客園 (cnblogs.com) 有介紹過遠程喚醒設備,後面這倆天瞭解多了點所以單獨加個隨筆 設備關機的情況下,使用網路喚醒的前提條件: 1. 被喚醒設備需要支持這WakeOnL ...
  • 前言 大家好,推薦一個.NET 8.0 為核心,結合前端 Vue 框架,實現了前後端完全分離的設計理念。它不僅提供了強大的基礎功能支持,如許可權管理、代碼生成器等,還通過採用主流技術和最佳實踐,顯著降低了開發難度,加快了項目交付速度。 如果你需要一個高效的開發解決方案,本框架能幫助大家輕鬆應對挑戰,實 ...