上一篇,我們講述了HBase的協處理器。 下麵我們開始介紹Impala的介紹及安裝。 ...
閱讀目錄
本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。
文章是哥(mephisto)寫的,SourceLink
序
上一篇,我們講述了HBase的協處理器。
下麵我們開始介紹Impala的介紹及安裝。
介紹
一:定義
Impala是Cloudera公司主導開發的新型查詢系統,它提供SQL語義,能查詢存儲在Hadoop的HDFS和HBase中的PB級大數據。和Hive相比,速度快了個數量級,具有非常好的互動式SQL執行。
三:架構
Impala Daemon
是Impala的核心進程,進程名叫做:impalad,運行在所有的數據節點上,可以讀寫數據,並接收客戶端的查詢請求,並行執行來自集群中其他節點的查詢請求,將中間結果返回給調度節點。調用節點將結果返回給客戶端。
Impala Statestore
狀態管理進程,定時檢查The Impala Daemon的健康狀況,協調各個運行impalad的實例之間的信息關係,Impala正是通過這些信息去定位查詢請求所要的數據,進程名叫做 statestored,在集群中只需要啟動一個這樣的進程,如果Impala節點由於物理原因、網路原因、軟體原因或者其他原因而下線,Statestore會通知其他節點,避免查詢任務分發到不可用的節點上。
Impala Catalog Service
元數據管理服務,進程名叫做 catalogd,將數據表變化的信息分發給各個進程。
安裝
一:新增服務
二:勾選Impala
三:分配服務
四:存儲配置
五:添加服務進行中
六:添加完成
--------------------------------------------------------------------
到此,本章節的內容講述完畢。
系列索引
本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。
文章是哥(mephisto)寫的,SourceLink