談談數據中台技術體系

来源:https://www.cnblogs.com/zhengyun_ustc/archive/2019/11/11/datamdev.html
-Advertisement-
Play Games

我們的數據中台在最近兩年發展得更有體系了,這與公司裂變、業務規模激增引發的,當然也跟我們高屋建瓴、高舉高打分不開。 ...


昀哥 20191109

我們做大數據很早,2011年、2012年就開始了,到現在基本形成了一整套完整的數據中台體系。大數據基本為這三件事服務:

1.決策依據和經營分析

2.運營調度

3.外部機構盡職調查和穿刺

各個公司各條業務線對數據高度敏感,尤其是打仗(有仗打仗,沒仗造仗)的時候基本上是實時調度,加之公司多,數據來源多,機房多,交易量大(每日1000+萬),實時性要求高,所以需要一套行之有效的數據中台來支撐。

 

首先,我們把大數據技術領域劃分為六塊,如下圖所示。

  1. 元數據管理:分為技術元數據業務元數據。技術元數據描述數據倉庫技術細節。業務元數據從商業和業務的角度描述數據倉庫中的數據,使業務人員更好地、全面地理解數據倉庫中分析出來的數據。其中最經典的場景就是血緣(動態)分析。

  2. 協作調度:不管是離線計算,還是實時計算,都需要一套調度和管理系統來幫助數據倉庫工程師平滑地完成測試環境、生產環境的計算任務的打包、提交、測試、核驗數據和發佈。

  3. 自助分析:也可以叫即席查詢。具有一定經驗的運營人員或數據分析師可以利用自助BI系統完成數據提取、數據分析和展示,所見即所得。

  4. 數據可視化:指的是預先通過可視化系統配置好的各種監控大屏和經營分析報表。

  5. 運維監控告警:對集群組件安裝和升級,對數據遷移,對集群運轉情況,需要有一個能讓運維人員和數據倉庫工程師解脫出來的解決方案。

  6. 數據資產管理(含數據質量):在元數據管理基礎之上,第一層需要數據質量保障,即有一套明確的保障機制,對生產出來的數據做校驗,確保數據無誤,否則就要找到數據失真的原因並告警。第二層是梳理盤點數據資產,準確計量數據資產,準確掌握數據資產的開放情況,形成治理閉環。

 

其次,我們的數據中台在最近兩年發展得更有體系了,這與公司裂變、業務規模激增引發的,當然也跟我們高屋建瓴、高舉高打分不開。

如果分層來劃分的話,可以把工作成果分為業務交付和過程管控兩啪,如下圖所示。

簡單做一個系統概述和技術棧說明:

業務交付:

-自助報表:自窩窩以來我們就有一套嚮導式的報表自助配置系統,絕大多數經營分析報表(一般是T+1數據彙總和明細)都是這麼配置出來的,有彙總有明細有圖有表有篩選有排序有導出。

-數屏:一種高逼格數據應用,它的目標是通過圖形化界面快速搭建可視化監控大屏,數屏可以提供豐富的可視化數據組件,滿足業務監控、會議展覽、投資咨詢等多種業務的展示需求,尤其要滿足PC瀏覽器或者手機瀏覽器訪問下的自適應佈局。

-數據開放實驗室:一種即席查詢和自助分析系統,它的目標是將我們收集到的各種數據,授權下游企業使用,通過即席查詢定義API,通過API獲取數據,併進一步做可視化分析,製作報表。它的用戶既有企業內部用戶,也有企業外部用戶。

-天演:不懂SQL或是資料庫結構的非技術人員,讓他們能自由地上傳臨時數據、關聯授權數據、探索數據,回答自己的問題,建立自己的個人數據工作台,有圖有表能下鑽,從巨集觀到微觀。也因此數據查詢交互速度要足夠快,選Druid,杠杠的。

過程管控:

-魔盒:既然業務開發有研發協作平臺、資料庫自動化運維平臺和運維自動化平臺,那麼大數據開發也肯定需要有一個協作平臺。所謂協作平臺,指的是圍繞著四個核心概念(資源,數據,流程,操作)構建一個體系(資源能看見,流程能流轉,數據能共用,操作有記錄),流程驅動數據和資源,操作可視化和可追蹤,形成閉環。底層實際是Azkaban。

-移山:異構數據源之間的數據遷移自動化平臺,它旨在解決第三方數據接入、實時數據(單向/雙向)同步、大數據集群間的數據遷移等問題。本質上是Canal和Kafka。

-磐石:基於Ambari的運維監控告警系統。

-能量塊:元數據管理系統。

 

數據中台在整個大中台的位置如下圖所示。

上面這套大中台體系,我們已經運轉自如,大勢已成。

-EOF-

 

歡迎關註公眾號:老兵筆記

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這一篇接著記錄一下查詢相關的操作。想象一下,如果想要在一張表格中展示某些車輛的耗損和營收情況,我們該怎麼處理。車輛、耗損、營收各自存儲在一張表中,耗損和營收中冗餘了車輛信息……我們便想到了關聯查詢。mongodb 3.2+中開始支持關聯查詢,下麵介紹一下寫關聯查詢的過程。 測試一、 結合前面筆記的成 ...
  • MySQL中GROUP BY隱式排序是什麼概念呢? 主要是其它RDBMS沒有這樣的概念,如果沒有認真瞭解過概念,對這個概念會感覺有點困惑,我們先來看看官方文檔的介紹: 官方文檔MySQL 5.7 Reference Manual中的“.2.1.14 ORDER BY Optimization”章節有... ...
  • oracle刪除表,如果表不存在,就報錯,在跑大型腳本(腳本長且耗時的時候)比較麻煩,一般希望的是點開始然後腳本運行到結束,不可能一直盯著屏幕等彈出提示手工點掉,mysql就很好有drop table if not exist功能CREATE OR REPLACE PROCEDURE p_drop_... ...
  • 1、將mysql壓縮包解壓至 /usr/local 文件夾下,將其改名為mysql#解壓tar -zxf mysql-5.7.27-el7-x86_64.tar.gz -C /usr/local/#重命名cd /usr/local/mv mysql-5.7.27-el7-x86_64/ mysql2... ...
  • MySQL事務 事務存在的原因 事務存在的目的:保證用戶對數據操作對數據是安全的。(比如說銀行卡餘額) 事務的特性——ACID 原子性:一個事務要麼全部執行,要麼不執行 一致性:事務開始和結束時,數據保持一致 隔離性:事務之間互不影響 持久性:事務操作的結果具有持久性 關於臟讀,不可重覆讀,幻讀 臟 ...
  • 記錄一個清除MySQL里binlog日誌的命令,可用在定時任務腳本里。 只保留1天前的日誌: PURGE MASTER LOGS BEFORE DATE_SUB(CURRENT_DATE, INTERVAL 1 DAY) ...
  • 本文使用版本基於elasticsearch 6.4.0 1、什麼是ES? 官網: "https://www.elastic.co/products/elasticsearch" 中文官網:https://www.elastic.co/cn/products/elasticsearch ES是一個全文 ...
  • You have a scheduler job that generated an error. When the error occurred, you attempted to disable the job to investigate the error, but received an ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...