從零自學Hadoop(23)：Impala介紹及安裝

-Advertisement-

上一篇，我們講述了HBase的協處理器。　下麵我們開始介紹Impala的介紹及安裝。 ...

閱讀目錄

序
介紹
安裝
系列索引

本文版權歸mephisto和博客園共有，歡迎轉載，但須保留此段聲明，並給出原文鏈接，謝謝合作。

文章是哥(mephisto)寫的，SourceLink

序

上一篇，我們講述了HBase的協處理器。

　下麵我們開始介紹Impala的介紹及安裝。

介紹

一：定義

　　Impala是Cloudera公司主導開發的新型查詢系統，它提供SQL語義，能查詢存儲在Hadoop的HDFS和HBase中的PB級大數據。和Hive相比，速度快了個數量級，具有非常好的互動式SQL執行。

三：架構

　

Impala Daemon

　　是Impala的核心進程，進程名叫做：impalad，運行在所有的數據節點上，可以讀寫數據，並接收客戶端的查詢請求，並行執行來自集群中其他節點的查詢請求，將中間結果返回給調度節點。調用節點將結果返回給客戶端。

Impala Statestore

　　狀態管理進程，定時檢查The Impala Daemon的健康狀況，協調各個運行impalad的實例之間的信息關係，Impala正是通過這些信息去定位查詢請求所要的數據，進程名叫做 statestored，在集群中只需要啟動一個這樣的進程，如果Impala節點由於物理原因、網路原因、軟體原因或者其他原因而下線，Statestore會通知其他節點，避免查詢任務分發到不可用的節點上。

Impala Catalog Service

　　元數據管理服務，進程名叫做 catalogd，將數據表變化的信息分發給各個進程。

安裝

一：新增服務

　　

二：勾選Impala

　　

三：分配服務

　　

　　

四：存儲配置

　　

五：添加服務進行中

　　

六：添加完成

　　

　　

　　

--------------------------------------------------------------------

　　到此，本章節的內容講述完畢。

系列索引

　　【源】從零自學Hadoop系列索引

本文版權歸mephisto和博客園共有，歡迎轉載，但須保留此段聲明，並給出原文鏈接，謝謝合作。

文章是哥(mephisto)寫的，SourceLink

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Spark實現K-Means演算法

K-Means演算法是一種基於距離的聚類演算法，採用迭代的方法，計算出K個聚類中心，把若幹個點聚成K類。用Spark實現K-Means演算法，首先修改pom文件，引入機器學習MLlib包：代碼：使用textFile()方法裝載數據集，獲得RDD，再使用KMeans.train()方法根據RDD、K值 ...
使用 zabbix 自動發現監控 MySQL

介紹使用 zabbix 的 low-level 自動發現功能完成單主機多埠的監控, 詳見low_level_discovery, 整體上監控類似 percona 的 zabbix 監控插件, 不過使用 mymonitor.pl 替換了腳本 ss_get_mysql_stats.php, 而且配置 ...
Mysql學習筆記007

計數行直接上慄子：客戶想要知道有多少pet了，腫麽辦?（需要用到一個COUNT(*)的函數）操作如下： SELECT COUNT(*) FROM pet; mysql> SELECT COUNT(*) FROM pet;+ +| COUNT(*) |+ +| 9 |+ +1 row in se ...
mysql用戶創建及授權

一、創建用戶: 命令:CREATE USER 'username'@'host' IDENTIFIED BY 'password'; 說明:username - 你將創建的用戶名, host - 指定該用戶在哪個主機上可以登陸,如果是本地用戶可用localhost, 如果想讓該用戶可以從任意遠程主 ...
Mysql索引類型

在MySQL 中，主要有四種類型的索引，分別為：B-Tree 索引，Hash 索引，Fulltext 索引和RTree索引 1、B-Tree 索引 B-Tree 索引是MySQL 資料庫中使用最為頻繁的索引類型，除了Archive 存儲引擎之外的其他所有的存儲引擎都支持B-Tree 索引。不僅僅在M ...
關於DDL、DML和DCL的區別與理解

2017年5月31日，天氣陰。近期事情頗多，心情比較沉重。端午剛過，早上上課，很多同學還處在端午的疲憊狀態中沒有回過神來，當然我也不例外。端午奔波三天，加上畢設的事情，可以說身心俱疲。狀態不佳，整理了一下以前的筆記，發現很多知識點記憶不清了，甚至有些幾乎沒印象了。下麵把自己對DDL、DML和DCL ...
Redis 小白指南（二）- 基礎命令和五大類型：字元串、散列、列表、集合和有序集合

Redis 小白指南（二）- 基礎命令和五大類型：字元串、散列、列表、集合和有序集合引言開篇已經介紹了 Redis 安裝、GUI 和 C# 驅動等基本知識，這一篇主要是梳理一下 Redis 的 5 種類型的信息與指令。目錄字元串類型散列類型列表類型集合類型有序集合類型其它命令字元 ...
MySQL : 事務處理

【事務】一組SQL語句操作單元，組內所有SQL語句，完成一個業務。若整組成功，意味著組內的全部操作都成功；反之，若其中任何一條語句失敗，意味著整個操作都失敗。操作失敗，意味著整個過程都是沒有意義的，應使資料庫回到操作前的初始狀態。【point】1. 失敗後，能回到開始位置； 2. 成功之前， ...