一文帶你體驗MRS HetuEngine如何實現跨源跨域分析

来源:https://www.cnblogs.com/huaweiyun/archive/2022/09/15/16695809.html
-Advertisement-
Play Games

摘要: HetuEngine作為MRS服務中互動式分析&多源統一SQL引擎,親自全程體驗其如何實現多數據源的跨源跨域分析能力。 本文分享自華為雲社區《MRS HetuEngine體驗跨源跨域分析【玩轉華為雲】》,作者:龍哥手記。 HetuEngine作為MRS服務中互動式分析&多源統一SQL引擎,親 ...


摘要: HetuEngine作為MRS服務中互動式分析&多源統一SQL引擎,親自全程體驗其如何實現多數據源的跨源跨域分析能力。

本文分享自華為雲社區《MRS HetuEngine體驗跨源跨域分析【玩轉華為雲】》,作者:龍哥手記。

HetuEngine作為MRS服務中互動式分析&多源統一SQL引擎,親自全程體驗其如何實現多數據源的跨源跨域分析能力。

一場景完整描述

1.1 首先說明下

1)用戶通過登錄Windows跳板機,使用SQL開發工具DBeaver連接MRS集群A的HetuEngine進行分析體驗
2)跨源分析體驗,通過HetuEngine0連接集群內部數據源hive
3)跨源分析體驗,通過HetuEngine0連接集群內部數據源hbase
4)跨倉分析體驗,通過HetuEngine0連接關係型資料庫DWS
5)跨湖分析體驗,通過HetuEngine0連接到MRS集群B的HetuEngine1再連接到集群B的數據源hive

二 登錄環境並完成準備工作

2.1. 登錄跳板機

登錄:http://121.13.226.78:18080/ssh/#/

① 用戶名:hdc01,
② 密碼:請聯繫現場引導員獲取

2.2 登錄認證軟體MIT Kerberos進行認證

點擊右下角的MIT Kerberos,選擇Get Tickets輸入用戶名密碼獲取Kerberos認證票據

① Principal:[email protected]
② Password: Admin12!

2.3 打開SQL編輯器軟體DBeaver

2.4 查看已配置好的MRS集群A的HetuEngine連接

點擊三角符號打開已配置好的HetuEngine連接

說明:

① dws: 外部dws資料庫
② hbase: MRS集群A中的hbase數據源
③ hetu1: 遠端MRS集群B的HetuEngine
④ hive: MRS集群A中的hive數據源

三 體驗HetuEngine hive查詢性能提升

3.1 通過普通JDBC查詢MRS集群A中的hive表

選擇配置好的hive數據源92-hive - New Connection,右鍵選擇SQL Editor

輸入以下SQL語句並查看結果與時間

SELECT * FROM sales h1 WHERE h1.price >30;

3.2. 通過HetuEngine查詢MRS集群A中的hive表

選擇配置好的hive數據源92-HetuEngine - New Connection,右鍵選擇SQL Editor

輸入以下的SQL語句並查看結果和時間

SELECT * FROM hive.default.sales h1 WHERE h1.price >30;

3.3. 結論

通過比較兩次查詢時間,可以看到HetuEngine會加速查詢性能,比普通的hive查詢更加快速;

四 體驗HetuEngine跨源、跨倉分析能力

4.1 通過HetuEngine對MRS集群A中的HBase進行跨源數據查詢

在打開的SQL Editor中輸入如下SQL語句查詢MRS集群A的HBase數據

SELECT * FROM hbase.default.sales;

4.2 通過HetuEngine對DWS集群C進行跨倉數據查詢

在打開的SQL Editor中輸入如下SQL語句查詢DWS集群C中的維表數據

SELECT * FROM dws.public.person;

4.3. 體驗MRS集群A的hive同DWS集群C跨倉分析查詢

在打開的SQL Editor中輸入如下SQL語句可做MRS集群A的hive與DWS集群C的跨倉數據分析

SELECT h1.id,h1.price, h1.ops_region,h1.ops_user_id,d1.sex,d1.age  FROM hive.default.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id WHERE h1.price >30;

4.4 體驗MRS集群A的hbase同DWS集群C跨倉分析查詢

在打開的SQL Editor中輸入如下SQL語句可做MRS集群A的hbase與DWS集群C的跨倉數據分析

SELECT  h1.id,h1.price, h1.ops_region,h1.ops_user_id,d1.sex,d1.age FROM hbase.default.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id WHERE h1.price >50;

4.5 下結論

出於管理和信息收集的需要,企業內部會存儲海量數據,包括數目眾多的各種資料庫、數據倉庫等,此時會面臨數據源種類繁多、數據集結構化混合、相關數據存放分散等困境,導致跨源查詢開發成本高,跨源複雜查詢耗時長。HetuEngine提供了統一標準SQL實現跨源協同分析,簡化跨源分析操作;

五 體驗HetuEngine跨湖分析能力

5.1 將MRS集群A的HetuEngine連接到MRS集群B的HetuEngine進行跨湖查詢

在打開的SQL Editor中輸入如下SQL語句可做MRS集群B中HetuEngine的hive跨湖查詢

SELECT * FROM  hetu1.hetu1_hive.sales;

5.2 體驗MRS集群B的HetuEngine同DWS集群C跨湖分析查詢

打開SQL Editor輸入如下SQL語句可做MRS集群B中HetuEngine的hive同DWS集群C的跨湖查詢

SELECT  h1.id,h1.price, h1.ops_region,h1.ops_user_id,d1.sex,d1.age   FROM  hetu1.hetu1_hive.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id;

5.3 結論

HetuEngine提供統一標準SQL對分佈於多個地域(或數據中心)的多種數據源實現高效訪問,屏蔽數據在結構、存儲及地域上的差異,實現數據與應用的解耦。

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • This blog introduces how to do SLAM related development natively on M1(Apple silicon) macbook. Most people come from Ubuntu environment will choose th ...
  • SqlServer對錶的基本操作 手動建庫建表 腳本建庫建表 SQL Server關係資料庫的數據表結構主要是由記錄(行)和欄位(列)構成,每一行代表唯一的一條記錄(Record),而每列則代表所有記錄中的一個域(Field)(也稱為欄位、屬性)。 註意:在同一個資料庫里,表的名字也必須是唯一的。在 ...
  • 本篇文章主要介紹MySQL中的鎖: 1.全局鎖 2.表級鎖(表鎖、意向鎖、元數據鎖 MDL) 3.行級鎖(行鎖、Gap Lock、Next-Key Lock) ...
  • ​ 點亮 ⭐️ Star · 照亮開源之路 https://github.com/apache/dolphinscheduler 本文目錄 1 DolphinScheduler的設計與策略 1.1 分散式設計 1.1.1 中心化 1.1.2 去中心化 1.2 DophinScheduler架構設計 ...
  • ##1.問題原因分析 出現這個問題的原因是插入數據的時候,由於之前沒有使用序列插入,而是直接插入了一個比當前序列nextval還大的值,即直接將id寫死了。後面再使用序列插入的時候,如果序列小於該值的話,是可以正常插入的,當序列號等於之前通過ID寫死的方式插入的ID值時,就會出現這種情況。 2.解決 ...
  • 更多技術交流、求職機會,歡迎關註位元組跳動數據平臺微信公眾號,回覆【1】進入官方交流群 相信大家都對大名鼎鼎的ClickHouse有一定的瞭解了,它強大的數據分析性能讓人印象深刻。但在位元組大量生產使用中,發現了ClickHouse依然存在了一定的限制。本篇將詳細介紹我們是如何為ClickHouse增強 ...
  • 背景 如果你有自建的 MySQL 集群,並且已經感受到了雲原生的春風拂面,想將數據遷移到 Kubernetes 上,那麼這篇文章可以給你一些思路。 文中將自建 MySQL 集群數據,線上遷移到 Kubernetes 的 MySQL 集群中,快速實現了 MySQL on Kubernetes。 適用場 ...
  • 更多技術交流、求職機會,歡迎關註位元組跳動數據平臺微信公眾號,回覆【1】進入官方交流群 1.前言 埋點設計文檔面向開發的埋點需求說明書,目的是讓開發理解需要在什麼情況下做哪些埋點採集,以及具體需要的屬性參數類型、取值,確保採集的準確性和完善性。為實現整體指標體系,數據產品落地、使用,需要對開發進行埋點 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...