GaussDB(DWS)成功將Greenplum上數萬個數據模型、數萬個代碼腳本、數百萬行代碼全部遷移至安全可控的數據倉庫平臺。 ...
本文分享自華為雲社區《開源資料庫Greenplum人去樓空?GaussDB(DWS)提供數倉新可能》,作者: 起個名字11111。
近日Greenplum關閉 GitHub 源碼事件在數倉行業廣受關註,代碼業界紛紛猜測Greenplum即將閉源。作為一款典型的OLAP資料庫,Greenplum的閉源勢必帶來數倉市場格局的調整與變化。國內有哪些備受矚目的數倉產品呢?華為雲數倉GaussDB(DWS)無疑是其中的佼佼者。
GaussDB(DWS)是一款相容PostgreSQL生態,同時GaussDB(DWS)具備豐富的GP遷移成功經驗。在某一遷移GP的成功案例中,面臨客戶原平臺擴展性不足、數據加工鏈路長、數據分散等痛點問題,GaussDB(DWS)成功將Greenplum上數萬個數據模型、數萬個代碼腳本、數百萬行代碼全部遷移至安全可控的數據倉庫平臺,基於GaussDB(DWS)的數據分析平臺成功降低系統管理成本、技術複雜度,提升了資源配置效率、數據一致性,承載30000多個數據模型。
DWS絲滑相容GP
GaussDB(DWS) 提供了配套的遷移工具,可支持TeraData、Oracle、MySQL、SQL Server、PostgreSQL、Greenplum、Impala等常用數據分析系統的平滑遷移。支持SQL 2003標準,相容Oracle的部分語法和數據結構,支持存儲過程,可與常用BI(business intelligence)工具無縫對接,業務遷移修改量極小。
1.語法相容性
(1)Greenplum和DWS均支持SQL 2003,相容大部分DDL與DML語法。
(2)相容GP所有數據類型。
(3)相容GP所有操作符。
(4)相容GP包括XML函數、JSON函數、視窗函數、聚集函數在內所有的複雜函數。
(5)支持自定義函數和PROCEDURE。
(6)支持Sort所有場景,包含FullSort/TopNSort。
(7)支持Agg/Join/Sort落盤功能。
(8)支持HashJoin/NestLoopJoin,完整支持Left/Right/Full/Inner/Anti/Semi六種Join規則。
(9)支持 GroupAgg/HashAgg/PlainAgg,及Agg所有相關特性。
(10)支持 HeapTable、Aocs Table的Scan,包含Seqscan和Index Scan。
2.生態相容性
(1)社區工具相容
數據集成:Talend、Kettle、DataX、DBT、Informatica等。
數據開發:Navicat、DBeaver、DbVisualizer等。
作業調度:Dataphin、Airflow等。
BI分析:QuickBI、永洪BI、FineBI、PowerBI、Tableau、Cognos、SmartBI等。
(2)華為工具相容:
數據集成:CDM、DRS、Migration等
數據開發:SQL Editor、DataArts Studio、DAS
BI分析:DataArts Insight
DWS產品優勢
1.易使用
(1) 一站式可視化便捷管理
GaussDB(DWS) 讓您能夠輕鬆完成從項目概念到生產部署的整個過程。通過使用GaussDB(DWS) 管理控制台,您不需要安裝數據倉庫軟體,也不需要部署數據倉庫伺服器,就可以在幾分鐘之內獲得高性能、高可靠的企業級數據倉庫集群。
您只需單擊幾下滑鼠,就可以輕鬆完成應用程式與數據倉庫的連接、數據備份、數據恢復、數據倉庫資源和性能監控等運維管理工作。
(2) 與大數據無縫集成
您可以使用標準SQL查詢HDFS、對象存儲服務(Object Storage Service,OBS)上的數據,數據無需搬遷。
(3) 提供一鍵式異構資料庫遷移工具
GaussDB(DWS) 提供配套的遷移工具,可支持MySQL、Oracle和Teradata的SQL腳本遷移到GaussDB(DWS) 。
2.高性能
(1) 雲化分散式架構
GaussDB(DWS) 採用全並行的MPP架構資料庫,業務數據被分散存儲在多個節點上,數據分析任務被推送到數據所在位置就近執行,並行地完成大規模的數據處理工作,實現對數據處理的快速響應。
(2) 查詢高性能,萬億數據秒級響應
GaussDB(DWS) 通過運算元並行執行、向量化執行引擎實現指令在寄存器並行執行,以及LLVM動態編譯減少查詢時冗餘的條件邏輯判斷,助力數據查詢性能提升。
GaussDB(DWS)支持行列混合存儲,可以同時為用戶提供更優的數據壓縮比(列存)、更好的索引性能(列存)、更好的點更新和點查詢(行存)性能。
(3) 數據載入快
GaussDB(DWS)提供了GDS極速並行大規模數據載入工具。
3.易擴展
(1) 按需擴展:Shared-Nothing開放架構,可隨時根據業務情況增加節點,擴展系統的數據存儲能力和查詢分析性能。
(2) 擴容後性能線性提升:容量和性能隨集群規模線性提升,線性比0.8。
(3) 擴容不中斷業務:擴容過程中支持數據增、刪、改、查,及DDL操作(Drop/Truncate/Alter table),表級別線上擴容技術,擴容期間業務不中斷、無感知。
支持線上升級:8.1.1及以上源版本支持大版本線上升級,8.1.3及以上源版本支持補丁線上升級,升級期間用戶無需停止業務,業務存在閃級秒斷。
4.高可靠
(1) ACID
支持分散式事務ACID(Atomicity,Consistency,Isolation,Durability),數據強一致保證。
(2) 全方位HA設計
GaussDB(DWS) 所有的軟體進程均有主備保證,集群的協調節點(CN)、數據節點(DN)等邏輯組件全部有主備保證,能夠保證在任意單點物理故障的情況下系統依然能夠保證數據可靠、一致,同時還能對外提供服務。
(3) 安全
GaussDB(DWS) 支持數據透明加密,同時可與資料庫安全服務(DBSS)對接,基於網路隔離及安全組規則,保護系統和用戶隱私及數據安全。GaussDB(DWS)還支持自動數據全量、增量備份,提升數據可靠性。
5.低成本
按需付費:GaussDB(DWS) 按實際使用量和使用時長計費。您需要支付的費率很低,只需為實際消耗的資源付費。
門檻低:您無需前期投入較多固定成本,可以從低規格的數據倉庫實例起步,後續隨時根據業務情況彈性伸縮所需資源,按需開支。
結語:
華為雲數據倉庫GaussDB(DWS),歷經13年的技術磨礪,已成為國內數據倉庫中的佼佼者,是中國唯一獲得數倉類CC安全認證的產品。華為雲GaussDB(DWS)一站式全場景雲數據倉庫,提供PB級數據分析能力、多模分析和實時處理能力,以統一內核提供公有雲、混合雲等部署形態,用戶體驗一致。在金融、泛政府、電信、能源、交通、醫療、物流、電商等領域,幫助1700+大客戶規模商用。
未來,GaussDB(DWS)將繼續深耕雲原生Serverless化、實時分析、湖倉一體、數智融合、HTAP等數倉核心技術,引領數據產業,創新構建開放融合、雲化、實時、全場景、智慧的數據底座。