ol7.7安裝部署4節點spark3.0.0分散式集群

-Advertisement-

為學習spark，虛擬機中開4台虛擬機安裝spark3.0.0底層hadoop集群已經安裝好，見ol7.7安裝部署4節點hadoop 3.2.1分散式集群學習環境首先，去http://spark.apache.org/downloads.html下載對應安裝包解壓[hadoop@master ~]$... ...

為學習spark，虛擬機中開4台虛擬機安裝spark3.0.0

底層hadoop集群已經安裝好，見ol7.7安裝部署4節點hadoop 3.2.1分散式集群學習環境

首先，去http://spark.apache.org/downloads.html下載對應安裝包

解壓

[hadoop@master ~]$ sudo tar -zxf spark-3.0.0-bin-without-hadoop.tgz -C /usr/local
[hadoop@master ~]$ cd /usr/local
[hadoop@master /usr/local]$ sudo mv ./spark-3.0.0-bin-without-hadoop/ spark
[hadoop@master /usr/local]$ sudo chown -R hadoop: ./spark

四個節點都添加環境變數

export SPARK_HOME=/usr/local/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

配置spark

spark目錄中的conf目錄下cp ./conf/spark-env.sh.template ./conf/spark-env.sh後面添加

export SPARK_MASTER_IP=192.168.168.11
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop
export SPARK_LOCAL_DIRS=/usr/local/hadoop
export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

然後配置work節點，cp ./conf/slaves.template ./conf/slaves修改為

master
slave1
slave2
slave3

寫死JAVA_HOME，sbin/spark-config.sh最後添加

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_191

複製spark目錄到其他節點

sudo scp -r /usr/local/spark/ slave1:/usr/local/
sudo scp -r /usr/local/spark/ slave2:/usr/local/
sudo scp -r /usr/local/spark/ slave3:/usr/local/
sudo chown -R hadoop ./spark/

...

啟動集群

先啟動hadoop集群/usr/local/hadoop/sbin/start-all.sh

然後啟動spark集群

通過master8080埠監控

完成安裝

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

.Net Core微服務入門全紀錄（八）——Docker Compose與容器網路

Tips：本篇已加入系列文章閱讀目錄，可點擊查看更多相關文章。前言上一篇【.Net Core微服務入門全紀錄（七）——IdentityServer4-授權認證】中使用IdentityServer4完成了鑒權中心的搭建，配合網關實現了統一的授權認證。進行到這裡，系統環境已經比較複雜了，想把整個系統 ...
從封裝變化的角度看設計模式——對象創建

封裝變化之對象創建在對象創建的過程中，經常會出現的一個問題就是通過顯示地指定一個類來創建對象，從而導致緊耦合。這是因為創建對象時指定類名將使你受特定實現的約束而不是特定介面的約束。這會使未來的變化更加複雜。要避免這種情況，就應該間接地創建對象。這種緊耦合的問題很大程度是由new關鍵字帶來的，由於 ...
006.Nginx訪問控制

一 Nginx 連接限制 1.1 HTTP協議的連接與請求 HTTP是建立在TCP, 一次HTTP請求需要先建立TCP三次握手（稱為TCP連接），在連接的基礎上再進行HTTP請求。 HTTP請求建立在一次TCP連接基礎上，對於HTTP會話，一次TCP連接可以建立多次HTTP請求。 HTTP協議版本 ...
遇見SQL（2)

SQL自學筆記約束１.０概念及分類２.０非空約束 3.0 唯一約束 4.0 主鍵約束自動增長 5.0 外鍵約束級聯操作多表關係三種情況概述資料庫的備份和還原多表查詢 1.0 內連接查詢隱式內連接：用where條件消除無用數據顯示內連接： 2.0 外連接查詢 3.0 子查詢 ...
Git官方和創始人都推薦的Git權威指南，廣度深度和實戰性史無前例

先給大家看一下大佬們對這本書的評價，免得說我“標題黨” 版本控制是管理數據變更的藝術，無論數據變更是來自同一個人，還是來自不同的人(一個團隊)。版本控制系統不但要忠實地記錄數據的每一次變更，還要能夠幫助還原任何一-次歷史變更，以及實現團隊的協同工作等。Git就是版本控制系統中的佼佼者。當開源軟體 ...
CentOS 7 MySQL5.7 主從只同步部分庫或表

同步部分數據有兩個思路： master只發送需要的；優點：中繼日誌小；如果多從庫，只需要在主庫中統一控制缺點：中途修改比較麻煩，不能控制同步的表 slave只接收想要的優點：中途修改同步的表或庫方便；可以控制需要的表和庫缺點：中繼日誌大；如果從庫比較多，需要一個一個配置； master端 b ...
怎麼查看HBase表的創建時間

前幾天HBase出現了RIT告警，忽然發現發出告警的Region所屬的表並不是我創建出來的，於是就想看看這些表是怎麼來的。一時也沒什麼頭緒，就先看看這些表是什麼時候創建出來的吧，然後再根據時間點看看有誰操作了資料庫。那麼怎麼看表的創建時間呢？desc看一下，也沒有這個屬性啊。再細想呢，hbase ...
記一次線上服務CPU 100%的處理過程

告警正在開會，突然釘釘告警聲響個不停，同時市場人員反饋客戶在投訴系統登不進了，報504錯誤。查看釘釘上的告警信息，幾台業務伺服器節點全部報CPU超過告警閾值，達100%。趕緊從會上下來，SSH登錄伺服器，使用 top 命令查看，幾個Java進程CPU占用達到180%，190%，這幾個Java進程 ...