企業數字化轉型以數據為中心,通過數據驅動業務發展、管理協同和運營。因此,數字化轉型關鍵在於數據,數據治理則需先行。從而更好激發數據生產要素潛能,實現業務數據化、數據價值化,助力企業數字化轉型。 ## 那麼何為數據治理? 國際數據管理協會(DAMA)在其《DAMA數據管理知識體系指南(第2版)》一書中 ...
企業數字化轉型以數據為中心,通過數據驅動業務發展、管理協同和運營。因此,數字化轉型關鍵在於數據,數據治理則需先行。從而更好激發數據生產要素潛能,實現業務數據化、數據價值化,助力企業數字化轉型。
那麼何為數據治理?
國際數據管理協會(DAMA)在其《DAMA數據管理知識體系指南(第2版)》一書中將數據治理進行了定義,即數據治理是對數據資產管理行使權力、控制和共用決策(規劃、監測和執行)的系列活動。此外,DAMA還將數據治理作為數據管理十大知識領域的中心,負責知識領域的平衡和一致性。
DAMA提到數據治理的目標有三點:提升企業數據資產管理能力;定義、批准、溝通和實施數據管理的原則、政策、程式、指標、工具和責任;監控和指導政策合規性、數據使用和管理活動。
可以看出,DAMA給出了比較全面的解釋,但是距離企業可落地的數據治理還是距離較遠,更像是綱領性的介紹,因此對於如何進行數據標準的制定以及如何進行數據資產的評估都缺少具體的描述。
2020年,信通院牽頭制定數據治理服務商成熟度模型(DGS),這一評估模型填補了數據治理服務領域的空白。模型以數據治理服務項目實施運維的流程為主線,融合數據治理核心能力,包括6大能力域、21個能力項,其中6大能力域遵循一般性數據治理項目流程,具體如下:
1.需求管理能力域:提供方通過採集需求方的業務需求、數據需求、技術需求等,明確數據治理目標和範圍,並評估實施數據治理可行性;
2.資源評估能力域:提供方通過對數據來源、數據規模、數據分類、數據關係、數據時效性、專業軟體工具、存儲計算環境以及硬體資源等主要影響因素進行分析,以提升數據治理項目任務分解的準確性,指導識別項目中的潛在風險;
3.實施保障能力域:提供方通過制定實施規劃,建立組織保障,開展風險管理,確保數據治理項目的順利實施,降低風險和成本;
4.方案設計能力域是數據治理項目的核心環節,提供方通過制定相關規範體系和設計文檔,形成滿足甲方需求的數據治理體系;
5.方案實施能力域提供方通過依托相關平臺工具,實現方案的落地;
6.成果交付能力域包括試運行、成果驗收2個能力項。
當前企業對於數據治理服務的關註點已逐漸從平臺產品擴展至方案設計、實施交付、持續運營的全訪問服務體系。專業的團隊,是項目成功的關鍵,依托於專業的數據治理服務團隊和知識沉澱,開展項目實施工作。
數據治理組織建議
首先CIO或CDO是項目順利進行的關鍵角色,可以更高效地推動實施團隊與業務的融合。其次是項目的項目經理,負責項目的管理和資源調度,各階段人員及工作安排,項目計劃制定、進度控制、項目風險管理、項目質量把關等;技術負責人、系統架構師、項目管理專員是項目團隊的智囊團和質量保障;根據項目需求,安排不同崗位職能人員開展實施及售後工作,包括但不限於業務架構師、業務分析師、數據架構師、數據開發工程師、測試工程師、技術支持、運維工程師、產品專家、產品經理、客戶成功專員等。
數據治理步驟
項目交付主要分為4個步驟,以需求調研為切入點,以方案設計為規劃核心,以開發實施為交付重點,以上線運維為服務保障,依次穩步開展保證項目的順利實施。
第一步是需求調研:通過業務調研切入,以收集資料和訪談調研為抓手,瞭解業務流程和痛點,深挖根本原因。以數據調研作為後續方案設計的開端,結合業務調研的痛點與根本原因,瞭解數據系統的現狀後,以數據角度切入整體解決方案。
第二步是方案設計:以數據標準方案為基石,以場景規劃方案為需求原點,以數據架構方案為綱領,進行整個數據治理方案設計;以實際需求為主,形成規範的組織架構、管理制度,參考國標及行標,形成數據標準方案,為後續實施打下堅實基礎;通過需求調研整理客戶實施的場景範圍,輸出原型設計及指標清單,確認後輸出場景規劃文檔,以此確定整體需求範圍;根據整體需求範圍和數據系統現狀,搭建數據架構,劃分業務域及數據域,規劃後續開發實施的整體框架。
第三步是開發實施:確定整體方案後,進行產品部署、數據探查、數據同步工作,根據場景規劃和架構設計方案,遵循數據標準方案,進行數據開發與數據治理。
第四步是上線運維:整體開發完成後進行試運行,同步開展產品測試工作,均通過後進行產品驗收及正式上線,後續由運維部門進行巡檢及售後工作。
DGS對數據治理的方方面面進行瞭解釋,給出了模型規範和評估標準。對於企業來說,不管是想自己做數據治理,還是通過服務商來實現部分數據治理工作,DGS都提供了一套相對全面的參考指南。
目前,袋鼠雲已通過DGS三級評估。整體來看,目前數據治理提供商的數據工程服務能力優勢集中於數據資源評估、數據質量、數據標準等能力項。
《數棧產品白皮書》:https://www.dtstack.com/resources/1004?src=szsm
《數據治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm
想瞭解或咨詢更多有關袋鼠雲大數據產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky
同時,歡迎對大數據開源項目有興趣的同學加入「袋鼠雲開源框架釘釘技術qun」,交流最新開源技術信息,qun號碼:30537511,項目地址:https://github.com/DTStack