在本文中,我們將分享在為事務性數據構建高度可伸縮的多租戶分析服務時所吸取的教訓。我們將從大局和業務需求開始。然後描述具有用於數據準備、發佈和查詢引擎的批處理和互動式模塊的體繫結構,並註意相關的Spark技術。然後我們將深入Prism查詢引擎的內部,重點介紹所使用的Spark SQL、DataFram ...
在本文中,我們將分享在為事務性數據構建高度可伸縮的多租戶分析服務時所吸取的教訓。我們將從大局和業務需求開始。然後描述具有用於數據準備、發佈和查詢引擎的批處理和互動式模塊的體繫結構,並註意相關的Spark技術。然後我們將深入Prism查詢引擎的內部,重點介紹所使用的Spark SQL、DataFrames和Catalyst編譯器特性。我們將描述在編譯和執行複雜管道和查詢時遇到的問題,以及如何使用緩存、採樣和查詢編譯技術來支持互動式用戶體驗。
資源分享https://www.slidestalk.com/s/Lightning_Fast_Analyticsfor_Workday_Transactional_Data_