談談數據中台技術體系

来源:https://www.cnblogs.com/zhengyun_ustc/archive/2019/11/11/datamdev.html
-Advertisement-
Play Games

我們的數據中台在最近兩年發展得更有體系了,這與公司裂變、業務規模激增引發的,當然也跟我們高屋建瓴、高舉高打分不開。 ...


昀哥 20191109

我們做大數據很早,2011年、2012年就開始了,到現在基本形成了一整套完整的數據中台體系。大數據基本為這三件事服務:

1.決策依據和經營分析

2.運營調度

3.外部機構盡職調查和穿刺

各個公司各條業務線對數據高度敏感,尤其是打仗(有仗打仗,沒仗造仗)的時候基本上是實時調度,加之公司多,數據來源多,機房多,交易量大(每日1000+萬),實時性要求高,所以需要一套行之有效的數據中台來支撐。

 

首先,我們把大數據技術領域劃分為六塊,如下圖所示。

  1. 元數據管理:分為技術元數據業務元數據。技術元數據描述數據倉庫技術細節。業務元數據從商業和業務的角度描述數據倉庫中的數據,使業務人員更好地、全面地理解數據倉庫中分析出來的數據。其中最經典的場景就是血緣(動態)分析。

  2. 協作調度:不管是離線計算,還是實時計算,都需要一套調度和管理系統來幫助數據倉庫工程師平滑地完成測試環境、生產環境的計算任務的打包、提交、測試、核驗數據和發佈。

  3. 自助分析:也可以叫即席查詢。具有一定經驗的運營人員或數據分析師可以利用自助BI系統完成數據提取、數據分析和展示,所見即所得。

  4. 數據可視化:指的是預先通過可視化系統配置好的各種監控大屏和經營分析報表。

  5. 運維監控告警:對集群組件安裝和升級,對數據遷移,對集群運轉情況,需要有一個能讓運維人員和數據倉庫工程師解脫出來的解決方案。

  6. 數據資產管理(含數據質量):在元數據管理基礎之上,第一層需要數據質量保障,即有一套明確的保障機制,對生產出來的數據做校驗,確保數據無誤,否則就要找到數據失真的原因並告警。第二層是梳理盤點數據資產,準確計量數據資產,準確掌握數據資產的開放情況,形成治理閉環。

 

其次,我們的數據中台在最近兩年發展得更有體系了,這與公司裂變、業務規模激增引發的,當然也跟我們高屋建瓴、高舉高打分不開。

如果分層來劃分的話,可以把工作成果分為業務交付和過程管控兩啪,如下圖所示。

簡單做一個系統概述和技術棧說明:

業務交付:

-自助報表:自窩窩以來我們就有一套嚮導式的報表自助配置系統,絕大多數經營分析報表(一般是T+1數據彙總和明細)都是這麼配置出來的,有彙總有明細有圖有表有篩選有排序有導出。

-數屏:一種高逼格數據應用,它的目標是通過圖形化界面快速搭建可視化監控大屏,數屏可以提供豐富的可視化數據組件,滿足業務監控、會議展覽、投資咨詢等多種業務的展示需求,尤其要滿足PC瀏覽器或者手機瀏覽器訪問下的自適應佈局。

-數據開放實驗室:一種即席查詢和自助分析系統,它的目標是將我們收集到的各種數據,授權下游企業使用,通過即席查詢定義API,通過API獲取數據,併進一步做可視化分析,製作報表。它的用戶既有企業內部用戶,也有企業外部用戶。

-天演:不懂SQL或是資料庫結構的非技術人員,讓他們能自由地上傳臨時數據、關聯授權數據、探索數據,回答自己的問題,建立自己的個人數據工作台,有圖有表能下鑽,從巨集觀到微觀。也因此數據查詢交互速度要足夠快,選Druid,杠杠的。

過程管控:

-魔盒:既然業務開發有研發協作平臺、資料庫自動化運維平臺和運維自動化平臺,那麼大數據開發也肯定需要有一個協作平臺。所謂協作平臺,指的是圍繞著四個核心概念(資源,數據,流程,操作)構建一個體系(資源能看見,流程能流轉,數據能共用,操作有記錄),流程驅動數據和資源,操作可視化和可追蹤,形成閉環。底層實際是Azkaban。

-移山:異構數據源之間的數據遷移自動化平臺,它旨在解決第三方數據接入、實時數據(單向/雙向)同步、大數據集群間的數據遷移等問題。本質上是Canal和Kafka。

-磐石:基於Ambari的運維監控告警系統。

-能量塊:元數據管理系統。

 

數據中台在整個大中台的位置如下圖所示。

上面這套大中台體系,我們已經運轉自如,大勢已成。

-EOF-

 

歡迎關註公眾號:老兵筆記

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這一篇接著記錄一下查詢相關的操作。想象一下,如果想要在一張表格中展示某些車輛的耗損和營收情況,我們該怎麼處理。車輛、耗損、營收各自存儲在一張表中,耗損和營收中冗餘了車輛信息……我們便想到了關聯查詢。mongodb 3.2+中開始支持關聯查詢,下麵介紹一下寫關聯查詢的過程。 測試一、 結合前面筆記的成 ...
  • MySQL中GROUP BY隱式排序是什麼概念呢? 主要是其它RDBMS沒有這樣的概念,如果沒有認真瞭解過概念,對這個概念會感覺有點困惑,我們先來看看官方文檔的介紹: 官方文檔MySQL 5.7 Reference Manual中的“.2.1.14 ORDER BY Optimization”章節有... ...
  • oracle刪除表,如果表不存在,就報錯,在跑大型腳本(腳本長且耗時的時候)比較麻煩,一般希望的是點開始然後腳本運行到結束,不可能一直盯著屏幕等彈出提示手工點掉,mysql就很好有drop table if not exist功能CREATE OR REPLACE PROCEDURE p_drop_... ...
  • 1、將mysql壓縮包解壓至 /usr/local 文件夾下,將其改名為mysql#解壓tar -zxf mysql-5.7.27-el7-x86_64.tar.gz -C /usr/local/#重命名cd /usr/local/mv mysql-5.7.27-el7-x86_64/ mysql2... ...
  • MySQL事務 事務存在的原因 事務存在的目的:保證用戶對數據操作對數據是安全的。(比如說銀行卡餘額) 事務的特性——ACID 原子性:一個事務要麼全部執行,要麼不執行 一致性:事務開始和結束時,數據保持一致 隔離性:事務之間互不影響 持久性:事務操作的結果具有持久性 關於臟讀,不可重覆讀,幻讀 臟 ...
  • 記錄一個清除MySQL里binlog日誌的命令,可用在定時任務腳本里。 只保留1天前的日誌: PURGE MASTER LOGS BEFORE DATE_SUB(CURRENT_DATE, INTERVAL 1 DAY) ...
  • 本文使用版本基於elasticsearch 6.4.0 1、什麼是ES? 官網: "https://www.elastic.co/products/elasticsearch" 中文官網:https://www.elastic.co/cn/products/elasticsearch ES是一個全文 ...
  • You have a scheduler job that generated an error. When the error occurred, you attempted to disable the job to investigate the error, but received an ...
一周排行
    -Advertisement-
    Play Games
  • 1. 說明 /* Performs operations on System.String instances that contain file or directory path information. These operations are performed in a cross-pla ...
  • 視頻地址:【WebApi+Vue3從0到1搭建《許可權管理系統》系列視頻:搭建JWT系統鑒權-嗶哩嗶哩】 https://b23.tv/R6cOcDO qq群:801913255 一、在appsettings.json中設置鑒權屬性 /*jwt鑒權*/ "JwtSetting": { "Issuer" ...
  • 引言 集成測試可在包含應用支持基礎結構(如資料庫、文件系統和網路)的級別上確保應用組件功能正常。 ASP.NET Core 通過將單元測試框架與測試 Web 主機和記憶體中測試伺服器結合使用來支持集成測試。 簡介 集成測試與單元測試相比,能夠在更廣泛的級別上評估應用的組件,確認多個組件一起工作以生成預 ...
  • 在.NET Emit編程中,我們探討了運算操作指令的重要性和應用。這些指令包括各種數學運算、位操作和比較操作,能夠在動態生成的代碼中實現對數據的處理和操作。通過這些指令,開發人員可以靈活地進行算術運算、邏輯運算和比較操作,從而實現各種複雜的演算法和邏輯......本篇之後,將進入第七部分:實戰項目 ...
  • 前言 多表頭表格是一個常見的業務需求,然而WPF中卻沒有預設實現這個功能,得益於WPF強大的控制項模板設計,我們可以通過修改控制項模板的方式自己實現它。 一、需求分析 下圖為一個典型的統計表格,統計1-12月的數據。 此時我們有一個需求,需要將月份按季度劃分,以便能夠直觀地看到季度統計數據,以下為該需求 ...
  • 如何將 ASP.NET Core MVC 項目的視圖分離到另一個項目 在當下這個年代 SPA 已是主流,人們早已忘記了 MVC 以及 Razor 的故事。但是在某些場景下 SSR 還是有意想不到效果。比如某些靜態頁面,比如追求首屏載入速度的時候。最近在項目中回歸傳統效果還是不錯。 有的時候我們希望將 ...
  • System.AggregateException: 發生一個或多個錯誤。 > Microsoft.WebTools.Shared.Exceptions.WebToolsException: 生成失敗。檢查輸出視窗瞭解更多詳細信息。 內部異常堆棧跟蹤的結尾 > (內部異常 #0) Microsoft ...
  • 引言 在上一章節我們實戰了在Asp.Net Core中的項目實戰,這一章節講解一下如何測試Asp.Net Core的中間件。 TestServer 還記得我們在集成測試中提供的TestServer嗎? TestServer 是由 Microsoft.AspNetCore.TestHost 包提供的。 ...
  • 在發現結果為真的WHEN子句時,CASE表達式的真假值判斷會終止,剩餘的WHEN子句會被忽略: CASE WHEN col_1 IN ('a', 'b') THEN '第一' WHEN col_1 IN ('a') THEN '第二' ELSE '其他' END 註意: 統一各分支返回的數據類型. ...
  • 在C#編程世界中,語法的精妙之處往往體現在那些看似微小卻極具影響力的符號與結構之中。其中,“_ =” 這一組合突然出現還真不知道什麼意思。本文將深入剖析“_ =” 的含義、工作原理及其在實際編程中的廣泛應用,揭示其作為C#語法奇兵的重要角色。 一、下劃線 _:神秘的棄元符號 下劃線 _ 在C#中並非 ...