根據北京研精畢智信息咨詢發佈的調查報告,2018-2021年,全球數據存儲量由30ZB上升至55ZB左右,年平均增長率約為27.8%。到2022年,數據總存儲量進一步增加至65ZB以上,較2021年同期新增了約10ZB,同比增長18.2%。各市場主體對數據的重視程度不斷提升,數據應用逐步由批量處理向 ...
根據北京研精畢智信息咨詢發佈的調查報告,2018-2021年,全球數據存儲量由30ZB上升至55ZB左右,年平均增長率約為27.8%。到2022年,數據總存儲量進一步增加至65ZB以上,較2021年同期新增了約10ZB,同比增長18.2%。各市場主體對數據的重視程度不斷提升,數據應用逐步由批量處理向規模化存儲的方向發展。
隨著各行各業數字化轉型的深入,數據體量爆炸式增長。如何控制數據生產成本、發現有價值的數據,提高數據ROI,成了企業數字化轉型中後期的關鍵任務。
本文將為大家解析如何通過企業數據多維度治理,實現數據資產的最大化利用和價值發揮。
為什麼要做數據治理?
“降本增效”無疑是2023年的關鍵詞,無論是各行業巨頭還是中小企業,都在試圖通過持續的降本增效保持競爭優勢。而數據治理正是其中的關鍵一環。
控制生產成本
在數倉建設過程中,企業往往更關心數據的產生和交付,對於數據的治理沒有引起足夠的重視。當存在資源不足、成本攀高的情況時,無法明確優化成本的方向。對於大量的沉默數據存儲如何處理,冗餘的數據計算資源如何分配,也沒有針對性的措施。
數據治理的目的正在於快速識別和解決那些導致企業數據成本增加或數據質量下降的惡性因素,幫助企業降低數據成本,提高數據質量和可靠性,更好地支持業務決策和持續發展。
提高數據價值
數據資產可以幫助用戶建立數據標準、規範數據模型、輔助企業進行數據質量校驗,但同時也存在管理推動難、下層執行難等問題。如何有效識別價值數據、保留價值數據、推動價值數據落地是企業必須要考慮的一點。
數據治理可以幫助企業全面瞭解和掌握具有重要價值的數據,推動數據標準的落地實施,確保數據的準確性和一致性,提高數據質量。
如何實現數據治理?
國際數據管理協會在其《DAMA 數據管理知識體系指南》一書中,將數據治理作為數據管理十大知識領域的中心,負責知識領域的平衡和一致性,為各項數據管理活動提供總體指導策略。
如今,數據治理的重要性已不言而喻,然而大部分企業對於數據治理還有著一個普遍的共識,那就是:“數據治理說起來容易,做起來難!”
數據治理究竟應該怎麼治?在哪裡治?
制定數據治理規則
數據治理規則可從計算、存儲、質量、規範、價值五個維度進行配置,通過制定不同維度的治理規則,幫助企業優化存儲成本、避免資源浪費、提升數據質量、推動標準規範,實現數據價值。
● 計算維度
以每個項目的任務為基礎進行超長任務判斷、異常情況判斷,定義不同規則對應的建議處理方式,避免資源浪費。
● 存儲維度
以每個項目的數據表為基礎進行,定義不同規則對應的建議處理方式,優化存儲成本。
● 質量維度
以每個項目的任務為基礎進行,定義不同規則對應的建議處理方式,提升數據質量。
● 規範維度
以每個項目的數據表為基礎進行,定義不同規則對應的建議處理方式,推動標準規範落地。
● 價值維度
以每個項目的數據表為基礎進行,定義不同規則對應的建議處理方式,幫助企業瞭解數據使用情況,提升數據價值。
搭建數據治理工作台
數據治理實踐實施過程中,需要依托具體的平臺來執行。隨著技術的不斷發展,這些平臺的智能化程度也在不斷提高。
袋鼠雲數據治理中心支持搭建數據治理工作台,工作台可發起治理任務,並展示待處理的問題,處理方式建議,處理責任人及進展等,實現數據治理問題處理流程閉環,對數據治理過程的全生命周期進行管理。
● 建立個人工作台
個人工作台針對每個用戶,展示具體用戶的待處理問題列表。每個用戶可查看分配給自己的問題處理清單,查看目前待處理問題總數、已處理問題數、已延期問題數、加入白名單問題數等。
進行問題處理後系統會自動對該問題進行復驗,驗證無誤後該問題會變為“已處理”狀態;驗證有問題需再次進行處理,完成治理問題處理閉環管理。
● 治理任務配置
治理任務管理支持以項目維度進行治理任務管理,可配置治理任務的調度周期、治理通知信息,能夠查看每個治理項目的產生問題總數、待處理問題數、待分配問題數。
治理項處理可查看未分配的問題清單,可按照不同維度,不同的問題類別進行處理人的批量指派,指派問題時可設置該問題的處理時效(例如需要在3天內處理完成,若未完成記錄為延期處理問題數量),通知方式等。
● 治理成果全景概覽
數據治理成果總覽支持以全景視圖、項目視圖、個人視圖等多個視圖維度彙總展示治理概況,展示內容包含項目數量、任務數量、數據表數、待治理項數、資產健康分、分值變化趨勢、治理項變化趨勢等內容,便於企業全方位瞭解治理概況。
數據治理的價值
通過實施數據治理,企業可以對其數據收集、整合、清洗和處理等過程進行有效的管理和控制,以確保持續生成高質量的數據。這些經過治理的數據為企業提供了更明智的決策依據,所有這些舉措都將進一步推動企業的業務發展和創新管理。
袋鼠雲數據治理中心可持續監控平臺使用過程中數據存儲、任務計算、代碼開發、數據質量、數據規範、數據價值等維度存在的問題,並通過資產健康分的量化評估,從全局、項目、個人多個視圖角度呈現治理成果。
推動企業完善數據規範、優化數據質量、節約資源、降本增效,幫助企業高效達成治理目標,讓數據資產發揮價值。
我們將過往經驗彙集成冊,編寫了一本《數據治理行業實踐白皮書》,140頁深度乾貨,囊括15個典型成功案例,全書從方法論到實踐全面解碼數據治理,開闢數據治理新範式。豐富內容可免費下載,對數據治理感興趣的同學一定要看!
《數據治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm
《數棧產品白皮書》:https://www.dtstack.com/resources/1004?src=szsm
想瞭解或咨詢更多有關袋鼠雲大數據產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky
同時,歡迎對大數據開源項目有興趣的同學加入「袋鼠雲開源框架釘釘技術qun」,交流最新開源技術信息,qun號碼:30537511,項目地址:https://github.com/DTStack