1、部署基本信息說明: 1.1、主機信息 操作系統:選擇CentOS6.7 x86-64版本 MEM:64GB,CPU: E5-2630 v3 @ 2.40GHz, DISK:2TB*4(數據節點存儲,操作系統除外) 主機信息: 主機名 IP dcnn1 10.20.20.1 dcnn2 10.20 ...
1、部署基本信息說明: 1.1、主機信息 操作系統:選擇CentOS6.7 x86-64版本 MEM:64GB,CPU: E5-2630 v3 @ 2.40GHz, DISK:2TB*4(數據節點存儲,操作系統除外) 主機信息: 主機名 IP dcnn1 10.20.20.1 dcnn2 10.20.20.2 dcdn01 10.20.20.3 dcdn02 10.20.20.4 dcdn03 10.20.20.5 1.2、CDH版本信息 ClouderaManager:cm5.7.2 CDH:cdh5.7.2版本 2、部署步驟 2.1 下載安裝包 CM parcel離線安裝包:5.7.2 http://archive.cloudera.com/cm5/cm/5/cloudera-manager-centos7-cm5.7.2_x86_64.tar.gz CDH parcel離線安裝包:(5.7.2) http://archive.cloudera.com/cdh5/parcels/5.7/CDH-5.7.2-1.cdh5.7.2.p0.18-el6.parcel http://archive.cloudera.com/cdh5/parcels/5.7/CDH-5.7.2-1.cdh5.7.2.p0.18-el6.parcel.sha1 http://archive.cloudera.com/cdh5/parcels/5.7/manifest.json 2.2 賬號分配 建立安裝用戶bigdata,用戶配置sudo無密碼登錄許可權,後面都以bigdata用戶操作,也可以直接用root用戶操作 部署管理平臺的主機打通到其它主機的ssh免登陸(部署用戶,bigdata或者root),這裡用bigdata 2.3 主機名設置: 每台主機的/etc/hosts增加所有主機信息,並用hostname命令更改相應主機名 10.20.20.1 dcnn1 10.20.20.2 dcnn2 10.20.20.3 dcdn01 10.20.20.4 dcdn02 10.20.20.5 dcdn03 2.4網路配置(每台主機) 以dcnn1位例 vim /etc/sysconfig/network NETWORKING=yes HOSTNAME=dcnn1 通過
service network restart
重啟網路服務,生效
2.5關閉IPtables和SELINUX (每台主機)
sudo chkconfig iptables off
sudo /etc/init.d/iptables stop
關閉SELINUX(實際安裝過程中發現沒有關閉也是可以的,不知道會不會有問題,還需進一步進行驗證):
setenforce 0 (臨時生效)
修改:/etc/selinux/configx下的 SELINUX=disabled(重啟後永久生效)
2.6開啟NTP服務
這裡因為是和外網隔離的,配置自己的ntpd伺服器,ntp服務未安裝,請自行安裝,一般linux系統會預設安裝ntpd服務,但沒有啟動,沒有的可以自行安裝
配置ntp server:
1)打開ntp服務配置文件/etc/ntp.conf
2)增加內容
//忽略ntp要求封包
restrict default nomodify notrap
restrict 10.20.20.1 mask 255.255.255.0 nomodify
server 10.20.20.1
//表示NTP主伺服器是與自身的系統時鐘同步
server 127.127.1.0
//同步上層伺服器的stratum 大小不能超過或等於16
fudge 127.127.1.0 stratum 10
3)啟動
啟動服務:sudo service ntpd start
重啟生效:sudo chkconfig ntpd on
配置ntp client:
1)打開ntp服務配置文件/etc/ntp.conf
2)增加內容
server 10.20.20.1
3)啟動
啟動服務:sudo service ntpd start
重啟生效:sudo chkconfig ntpd on
註:ntp服務的配置,生效需要一段時間,我自己測試大概5分鐘左右,剛重啟ntp服務,檢查狀態並不一定正常。
2.7安裝JDK
我們使用建議版本1.8.0_60 因為CDH需要oracle的java(所有節點) CentOS自帶OpenJdk,不過運行CDH5需要使用Oracle的JDK,需要Java 7以上的支持。 先卸載自帶的OpenJdk,使用
rpm -qa | grep java
查詢java相關的包,使用rpm -e --nodeps 包名
卸載之。
安裝: rpm -ivh jdk-8u60-linux-x64.rpm
由於是rpm包並不需要我們來配置環境變數,我們只需要配置一個全局的JAVA_HOME變數即可,執行命令:
echo "JAVA_HOME=/usr/java/latest/" >> /etc/environment
2.8 安裝MySQL(安裝CentOS6.7自帶版本5.1.7)
mysql資料庫服務端:
sudo rpm -hvi mysql-5.1.73-5.el6_6.x86_64.rpm
sudo rpm -hvi perl-DBD-MySQL-4.013-3.el6.x86_64.rpm
sudo rpm -hvi mysql-server-5.1.73-5.el6_6.x86_64.rpm
chkconfig mysqld on
設置開機啟動,並service mysqld start
啟動mysql服務,
並根據提示設置root的初試密碼:
mysqladmin -u root password 'bigdata'
mysqladmin -u root -h dcnn1 password 'bigdata'
mysql資料庫客戶端:
sudo rpm -hvi mysql-5.1.73-5.el6_6.x86_64.rpm
創建資料庫和設置mysql資料庫訪問許可權:
#hive
create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
UPDATE user SET password=PASSWORD('hive') WHERE user='hive';
#activity monitor
create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
UPDATE user SET password=PASSWORD('amon') WHERE user='amon';
#oozie
create database oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
UPDATE user SET password=PASSWORD('oozie') WHERE user='oozie';
#report
create database report DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
UPDATE user SET password=PASSWORD('report') WHERE user='report';
FLUSH PRIVILEGES;
#設置root授權訪問以上所有的資料庫:
grant all privileges on *.* to 'root'@'dcnn1' identified by 'bigdata' with grant option;
flush privileges;
#授權用戶在服務端擁有資料庫的訪問許可權
grant all privileges on *.* to 'oozie'@'dcnn1 ' identified by 'oozie' with grant option;
grant all privileges on *.* to 'hive'@'dcnn1' identified by 'hive' with grant option;
grant all privileges on *.* to 'amon'@'dcnn1 ' identified by 'amon' with grant option;
grant all privileges on *.* to 'report'@'dcnn1 ' identified by 'report' with grant option;
flush privileges;
#授權root用戶在客戶端擁有資料庫的訪問許可權
GRANT ALL PRIVILEGES ON *.* TO 'hive'@'%' IDENTIFIED BY 'hive' WITH GRANT OPTION;
GRANT ALL PRIVILEGES ON *.* TO 'oozie'@'%' IDENTIFIED BY 'oozie' WITH GRANT OPTION;
GRANT ALL PRIVILEGES ON *.* TO 'amon'@'%' IDENTIFIED BY 'amon' WITH GRANT OPTION;
GRANT ALL PRIVILEGES ON *.* TO 'report'@'%' IDENTIFIED BY 'report' WITH GRANT OPTION;
flush privileges;
2.9安裝cm
cm和namenode復用了,機器太少了
1)將下載的cloudera-manager-centos7-cm5.7.2_x86_64.tar.gz上傳至dcnn1目錄/opt下(該目錄為Cloudera manager的預設目錄)
2)tar xvfz cloudera-manager*.tar.gz,解壓後生成兩個目錄cloudera和cm-5.7.2
3)所有節點創建用戶cloudera-scm
sudo useradd --system --home=/opt/cm-5.7.2/run/cloudera-scm-server/ --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm
4)為Cloudera Manager 5建立資料庫
首先需要去MySql的官網下載JDBC驅動mysql-connector-java-5.1.38.tar.gz(可以下載最新的版本),下載地址:http://dev.mysql.com/downloads/connector/j/ ,解壓後找到mysql-connector-java-5.1.38-bin.jar放到/opt/cm-5.7.2/share/cmf/lib/中: cp mysql-connector-java-5.1.38-bin.jar /opt/cm-5.7.2/share/cmf/lib/
/opt/cm-5.7.2/share/cmf/schema/scm_prepare_database.sh mysql cm -h dcnn1 -uroot -pbigdata --scm-host dcnn1 scm scm scm
遇到問題:未解決,但不影響後面得部署
AVA_HOME=/usr/java/jdk1.8.0_60
Verifying that we can write to /opt/cm-5.7.2/etc/cloudera-scm-server
log4j:ERROR Could not find value for key log4j.appender.A
log4j:ERROR Could not instantiate appender named "A".
Creating SCM configuration file in /opt/cm-5.7.2/etc/cloudera-scm-server
Executing: /usr/java/jdk1.8.0_60/bin/java -cp /usr/share/java/mysql-connector-java.jar:/usr/share/java/oracle-connector-java.jar:/opt/cm-5.7.2/share/cmf/schema/../lib/* com.cloudera.enterprise.dbutil.DbCommandExecutor /opt/cm-5.7.2/etc/cloudera-scm-server/db.properties com.cloudera.cmf.db.
log4j:ERROR Could not find value for key log4j.appender.A
log4j:ERROR Could not instantiate appender named "A".
agent配置
1)修改/opt/cm-5.7.2/etc/cloudera-scm-agent/config.ini中的server_host, server_host為主節點的主機名
2)同步Agent到其他節點
sudo scp -r /opt/cm-5.7.2 root@dcnn2:/opt/;
sudo scp -r /opt/cm-5.7.2 root@dcdn01:/opt/;
sudo scp -r /opt/cm-5.7.2 root@dcdn02:/opt/;
sudo scp -r /opt/cm-5.7.2 root@dcdn03:/opt/;
2.10啟動服務
通過sudo /opt/cm-5.7.2/etc/init.d/cloudera-scm-server start 啟動服務端
通過sudo /opt/cm-5.7.2/etc/init.d/cloudera-scm-agent start 啟動agent端
我們啟動的其實是個service腳本,需要停止服務將以上的start參數改為stop就可以了,重啟是restart。
2.11 通過cm部署CDH
1)登錄http://10.20.20.1:7180
2)根據嚮導就可以一步一步進行了,比較簡單。
3 遇到問題
1、hive和oozie啟動失敗
缺少JDBC驅動,因為我的mysql裝在遠端,這裡要訪問的時候要通過JDBC驅動。因此將mysql-connector-java-5.1.22-bin.jar添加到hive和oozie的lib:
sudo cp mysql-connector-java-5.1.38-bin.jar /opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/hive/lib
sudo cp mysql-connector-java-5.1.38-bin.jar /opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/oozie/libext
2、安裝後hive在查詢時失敗,原因是許可權問題
org.apache.hadoop.security.AccessControlException: Permission denied: user=bigdata, access=WRITE, inode="/user":hdfs:supergroup:drwxr-xr-x
最簡單的處理辦法是:服務範圍勾選去掉。