本文分享自華為雲社區《【手把手帶你玩轉HetuEngine】(一)HetuEngine快速上手》,作者:HetuEngine九級代言。 HetuEngine是什麼 HetuEngine是華為推出的高性能互動式SQL分析及數據虛擬化引擎。與大數據生態無縫融合,實現海量數據秒級互動式查詢;支持跨源跨域統 ...
本文分享自華為雲社區《【手把手帶你玩轉HetuEngine】(一)HetuEngine快速上手》,作者:HetuEngine九級代言。
HetuEngine是什麼
HetuEngine是華為推出的高性能互動式SQL分析及數據虛擬化引擎。與大數據生態無縫融合,實現海量數據秒級互動式查詢;支持跨源跨域統一訪問,使能數據湖內、湖間、湖倉一站式SQL融合分析。
HetuEngine適合做什麼
- 適用於Hadoop集群(FusionInsight MRS)的Hive、Hudi數據源的互動式快速查詢場景;
- 適用於跨源(多種數據源,如Hive,Hudi,HBase,GaussDB(DWS),Elasticsearch,ClickHouse等)查詢;
- 適用於跨域(多個地域或數據中心)的快速聯合查詢;
- 不擅長大批量、複雜邏輯的跑批處理、創建事務、數據入庫操作等。
HetuEngine特點
HetuEngine基本架構
HetuEngine面向企業級能力方面,構建了極致穩定、高性能的企業級互動式分析引擎。
- 雲服務層:提供了企業級的運維管理監控能力,認證與業務接入統一訪問入口,友好的可視化界面操作,一鍵式參數調優和配置,協助用戶輕鬆簡單的管理集群平臺;
- 引擎層:純計算引擎部署,與數據解耦;自容錯,節點故障級別重啟,記憶體溢出保護等;計算實例基於任務負載自動彈性伸縮,可水平橫向擴展;
- 數據層:支持多種常見的數據源間的聯合查詢,同時計算和數據解耦,天然的存算分離架構。
HetuEngine服務角色
HeuEngine引擎架構
HetuEngine引擎執行流程簡單介紹:
Coordinator
負責管理Worker節點,以及接受客戶端查詢請求,併進行SQL的語法解析(Parser)、執行計劃生成與優化(Plannner)和查詢任務的調度(Scheduler)
Worker
負責具體的查詢計算和數據讀寫
Discovery Server
負責發現集群的各個節點,用於節點間心跳監控
快速上手指南
工欲善其事必先利其器,在使用HetuEngine之前,首先需要瞭解基本的架構,並與業務場景相結合,然後進行集群相關的規劃和配置,最後進行業務對接和驗證上線。本系列將從以下幾方面內容手把手帶你玩轉HetuEngine。
- 瞭解HetuEngine的基本架構:瞭解HetuEngine是什麼
- 瞭解HetuEngine常見的應用場景,與業務場景相結合:判斷HetuEngine是否適應於業務場景
- 集群部署和資源規劃:前期的資源規劃必不可少
- 數據源添加和管理:對接業務需要的數據源
- 許可權管控和配置:保障不同業務用戶之間的許可權管控
- 業務對接:業務對接和驗證
- 性能調優:不同的調優手段
- 運行過程中常見問題排查:常見問題的處理方式