熟悉的 Kylin 的朋友都知道,Apache Kylin 構建完的數據是存儲在 HBase 中的。Kylin on HBase 方案經過長時間的發展已經比較成熟,但是也還存在著一定的局限性。面對以上問題,Kyligence 推出了 Kylin On Parquet 方案。 ...
熟悉的 Kylin 的朋友都知道,Apache Kylin 構建完的數據是存儲在 HBase 中的。Kylin on HBase 方案經過長時間的發展已經比較成熟,但是也還存在著一定的局限性。Kylin 當前主要的計算是在單機節點完成的,存在單點問題。而且由於 HBase 非真正列存的問題,Cuboids 信息需要壓縮編碼,讀取 HBase 數據的時候再反序列化、分割,額外增加了計算壓力。另外,HBase 運維難度比較大,不便於上雲。面對以上問題,Kyligence 推出了 Kylin On Parquet 方案。
Kyligence 在 2018 年開始策劃 Kylin On Parquet 方案,在 Kylin 商業版中驗證了方案的可行性和優勢,如今便貢獻回開源社區。Kylin On Parquet 依托 Spark,能夠做到分散式計算,不再存在單點瓶頸,調試也會更加方便。並且去 Hadoop,只需依賴 Spark,能夠很好的支持雲上存儲和部署。
目前,Kylin on Parquet 源碼已經開源:https://github.com/Kyligence/kylin-on-parquet-v2。
在本次直播中,來自 Kyligence 的大數據研發工程師王汝鵬將帶大家快速瞭解 Kylin on Parquet 的架構、原理以及如何開發調試代碼。
Kylin Online 第 4 期
Kylin on Parquet 介紹及快速上手
活動亮點
1. Kylin on Parquet 方案的架構介紹、原理講解,以及與 Kylin 原有構建查詢引擎的性能比較。
2. Live Demo 帶您瞭解如何使用、開發與調試 Parquet 代碼。
3. Q&A 環節為您答疑解惑,您也有機會獲贈「Kylin 權威指南」~
哪些人應該參加
1. 想嘗鮮 Kylin 最新一代存儲方式,希望與志同道合的 Kylin Contributor 們一起探討與參與 Kylin on Parquet 開發。
2. 有興趣瞭解下一代 Kylin 面向雲原生 OLAP 引擎的架構原理。
直播時間
4 月 18 日(下周六) 20:00 – 21:00
關於講師
王汝鵬,Kyligence 公司大數據研發工程師,Apache Kylin Contributor,目前主要負責開源 Kylin 構建引擎的維護和 Kylin on Parquet 的開源工作。
如何報名
↓掃描下方二維碼報名↓

報名截止時間:4 月 18 日(下周六) 12:00
報名前請認真閱讀下方報名提示,以免錯過直播:
1. 本次活動的所有信息將通過郵件、活動微信群與您同步,務必正確填寫郵箱及電話。
2. 活動中參與互動,將有機會 pick 隨機掉落的精美社區周邊以及書籍哦~