spark-2.4.0-hadoop2.7-高可用(HA)安裝部署

来源:https://www.cnblogs.com/zhanglianghhh/archive/2018/12/02/10054816.html
-Advertisement-
Play Games

1. 主機規劃 主機名稱 IP地址 操作系統 部署軟體 運行進程 備註 mini01 172.16.1.11【內網】 10.0.0.11 【外網】 CentOS 7.5 Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、sp ...


 

1. 主機規劃

主機名稱

IP地址

操作系統

部署軟體

運行進程

備註

mini01

172.16.1.11【內網】

10.0.0.11  【外網】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、spark-2.4.0-hadoop2.7【主】

QuorumPeerMain、

 

mini02

172.16.1.12【內網】

10.0.0.12  【外網】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、spark-2.4.0-hadoop2.7【主】

QuorumPeerMain、

 

mini03

172.16.1.13【內網】

10.0.0.13  【外網】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、kafka_2.11-2.0.0、spark-2.4.0-hadoop2.7

QuorumPeerMain、

 

mini04

172.16.1.14【內網】

10.0.0.14  【外網】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、spark-2.4.0-hadoop2.7

QuorumPeerMain、

 

mini05

172.16.1.15【內網】

10.0.0.15  【外網】

CentOS 7.5

Jdk-8、zookeeper-3.4.5、Hadoop2.7.6、hbase-2.0.2、spark-2.4.0-hadoop2.7

QuorumPeerMain、

 

 

說明

       藉助zookeeper,並且啟動至少兩個Master節點來實現高可靠。

 

 

2. 免密碼登錄

實現mini01、mini02到mini01、mini02、mini03、mini04、mini05通過秘鑰免密碼登錄。

參見文章:Hadoop2.7.6_01_部署

 

 

3. Jdk【java8】

參見文章:Hadoop2.7.6_01_部署

 

 

4. Zookeeper部署

參見文章:zookeeper-02 部署

 

       並啟動zookeeper服務

 

 

5. Spark部署步驟

5.1. Spark安裝

 1 [yun@mini01 software]$ pwd
 2 /app/software
 3 [yun@mini01 software]$ ll
 4 total 238572
 5 -rw-r--r--  1 yun yun 227893062 Nov 19 21:24 spark-2.4.0-bin-hadoop2.7.tgz
 6 [yun@mini01 software]$ tar xf spark-2.4.0-bin-hadoop2.7.tgz  
 7 [yun@mini01 software]$ mv spark-2.4.0-bin-hadoop2.7 /app/  
 8 [yun@mini01 software]$ cd /app/
 9 [yun@mini01 ~]$ ln -s spark-2.4.0-bin-hadoop2.7/ spark  
10 [yun@mini01 ~]$ ll -d spark-*   
11 drwxr-xr-x 13 yun yun 211 Oct 29 14:36 spark-2.4.0-bin-hadoop2.7
12 lrwxrwxrwx  1 yun yun  26 Nov 24 14:23 spark -> spark-2.4.0-bin-hadoop2.7/

 

5.2. 環境變數修改

  根據規劃,該環境變數的修改包括mini01、mini02、mini03、mini04、mini05

1 # 需要root許可權去添加環境變數
2 [root@mini01 ~]# tail /etc/profile
3 ………………
4 # spark環境變數
5 export SPARK_HOME="/app/spark"
6 export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH
7 
8 [root@mini01 ~]# logout
9 [yun@mini01 conf]$ source /etc/profile  # 重新載入該環境變數

 

5.3. 配置修改

 1 [yun@mini01 conf]$ pwd
 2 /app/spark/conf
 3 [yun@mini01 conf]$ cp -a spark-env.sh.template spark-env.sh  
 4 [yun@mini01 conf]$ tail spark-env.sh  # 修改環境變數配置
 5 # Options for native BLAS, like Intel MKL, OpenBLAS, and so on.
 6 # You might get better performance to enable these options if using native BLAS (see SPARK-21305).
 7 # - MKL_NUM_THREADS=1        Disable multi-threading of Intel MKL
 8 # - OPENBLAS_NUM_THREADS=1   Disable multi-threading of OpenBLAS
 9 
10 # 添加配置如下
11 # 配置JAVA_HOME
12 export JAVA_HOME=/app/jdk
13 # -Dspark.deploy.recoverMode=ZOOKEEPER #代表發生故障使用zookeeper服務
14 # -Dspark.depoly.zookeeper.url=mini01:2181,mini02:2181,mini03:2181,mini04:2181,mini05:2181 #zookeeper的連接信息
15 # -Dspark.deploy.zookeeper.dir=/app/zookeeper/spark #spark要在zookeeper上寫數據時的保存目錄
16 export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=mini01:2181,mini02:2181,mini03:2181,mini04:2181,mini05:2181 -Dspark.deploy.zookeeper.dir=/spark"
17 # 每一個Worker最多可以使用的記憶體,我的虛擬機就2g
18 # 真實伺服器如果有128G,你可以設置為100G
19 # 所以這裡設置為1024m或1g
20 export SPARK_WORKER_MEMORY=1024m
21 # 每一個Worker最多可以使用的cpu core的個數,我虛擬機就一個...
22 # 真實伺服器如果有32個,你可以設置為32個
23 export SPARK_WORKER_CORES=1
24 # 提交Application的埠,預設就是這個,萬一要改呢,改這裡
25 export SPARK_MASTER_PORT=7077
26 
27 [yun@mini01 conf]$ pwd
28 /app/spark /conf
29 [yun@mini01 conf]$ cp -a slaves.template slaves 
30 [yun@mini01 conf]$ tail slaves  # 修改slaves 配置
31 # distributed under the License is distributed on an "AS IS" BASIS,
32 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
33 # See the License for the specific language governing permissions and
34 # limitations under the License.
35 #
36 
37 # A Spark Worker will be started on each of the machines listed below.
38 mini03
39 mini04
40 mini05

 

配置說明

# -Dspark.deploy.zookeeper.dir=/app/zookeeper/spark   # spark要在zookeeper上寫數據時的保存目錄

1 [yun@mini05 ~]$ zkCli.sh  # 進入zookeeper命令行  【在spark啟動後查看】
2 [zk: localhost:2181(CONNECTED) 0] ls /   # 其中的 /spark 就是 我們在spark-env.sh中的配置
3 [cluster, brokers, zookeeper, yarn-leader-election, hadoop-ha, admin, isr_change_notification, log_dir_event_notification, controller_epoch, spark, consumers, latest_producer_id_block, config, hbase]
4 [zk: localhost:2181(CONNECTED) 1] ls /spark
5 [leader_election, master_status]
6 [zk: localhost:2181(CONNECTED) 2] ls /spark/master_status
7 [worker_worker-20181125113658-172.16.1.13-18433, worker_worker-20181125113658-172.16.1.14-14175, worker_worker-20181125113658-172.16.1.15-8887]
8 [zk: localhost:2181(CONNECTED) 3] ls /spark/leader_election
9 [_c_6c6d0c36-3017-4354-a05c-9414a78d79e2-latch-0000000000, _c_04ceffff-b763-454a-b3f1-7fb56f56fa84-latch-0000000001]

 

5.4. 分發到其他機器

  分發到mini02、mini03、mini04和mini05

  其中mini01和mini02作為master

1 [yun@mini01 ~]$ scp -pr spark-2.4.0-bin-hadoop2.7/ yun@mini02:/app  # 拷貝到mini02
2 [yun@mini01 ~]$ scp -pr spark-2.4.0-bin-hadoop2.7/ yun@mini03:/app  # 拷貝到mini03
3 [yun@mini01 ~]$ scp -pr spark-2.4.0-bin-hadoop2.7/ yun@mini04:/app  # 拷貝到mini04
4 [yun@mini01 ~]$ scp -pr spark-2.4.0-bin-hadoop2.7/ yun@mini05:/app  # 拷貝到mini05

 

在mini02、mini03、mini04和mini05上操作

1 [yun@mini04 ~]$ pwd
2 /app
3 [yun@mini04 ~]$ ll -d spark-2.4.0-bin-hadoop2.7
4 drwxr-xr-x 13 yun yun 211 Oct 29 14:36 spark-2.4.0-bin-hadoop2.7
5 [yun@mini04 ~]$ ln -s spark-2.4.0-bin-hadoop2.7/ spark  
6 [yun@mini04 ~]$ ll -d spark-*
7 drwxr-xr-x 13 yun yun 211 Oct 29 14:36 spark-2.4.0-bin-hadoop2.7
8 lrwxrwxrwx  1 yun yun  26 Nov 24 23:39 spark -> spark-2.4.0-bin-hadoop2.7/

 

5.5. 啟動spark

5.5.1. 在mini01上操作

 1 [yun@mini01 sbin]$ pwd
 2 /app/spark/sbin
 3 [yun@mini01 sbin]$ ./start-all.sh  # 關閉使用 stop-all.sh 腳本
 4 [yun@mini01 sbin]$ ./start-all.sh 
 5 starting org.apache.spark.deploy.master.Master, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.master.Master-1-mini01.out
 6 mini03: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker-1-mini03.out
 7 mini04: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker-1-mini04.out
 8 mini05: starting org.apache.spark.deploy.worker.Worker, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.worker.Worker-1-mini05.out
 9 [yun@mini01 ~]$ 
10 [yun@mini01 ~]$ jps  # 查看進程狀態 
11 4033 QuorumPeerMain
12 4683 Jps
13 4575 Master

 

5.5.2. 在mini02上操作

1 [yun@mini02 sbin]$ pwd
2 /app/spark/sbin
3 [yun@mini02 sbin]$ ./start-master.sh 
4 starting org.apache.spark.deploy.master.Master, logging to /app/spark/logs/spark-yun-org.apache.spark.deploy.master.Master-1-mini02.out
5 [yun@mini02 sbin]$ jps  # 查看進程狀態
6 2914 Master
7 2999 Jps
8 2313 QuorumPeerMain

 

5.5.3. mini03進程查看

1 [yun@mini03 ~]$ jps
2 2824 Jps
3 2558 QuorumPeerMain
4 2766 Worker

 

5.5.4. mini04進程查看

1 [yun@mini04 ~]$ jps 
2 2931 Jps
3 2824 Worker
4 2555 QuorumPeerMain

 

5.5.5. mini05進程查看

1 [yun@mini05 ~]$ jps 
2 2806 Jps
3 2747 Worker
4 2527 QuorumPeerMain

 

5.6. 瀏覽器訪問

1 http://mini01:8080/    

 

1 http://mini02:8080/    

 

說明

       如果我們停了mini01的spark master,稍等一會兒可見mini02的master狀態從standby變為了alive。

       此時再啟動mini01的master,可見mini01的master狀態是standby。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 爬蟲的定義 什麼是爬蟲? 爬蟲(又被稱為網頁蜘蛛,網路機器人)就是模擬客戶端發送網路請求,接收請求響應,一種按照一定的規則,自動地抓取互聯網信息的程式。 原則上,只要是瀏覽器(客戶端)能做的事情,爬蟲都能夠做。 爬蟲的分類和爬蟲的流程 爬蟲的分類 爬蟲的分類 根據被爬網站的數量不同,我們把爬蟲分為 ...
  • 1、if語句if 語句基本用法: 其中,表達式可以是一個單純的布爾值或變數,也可以是比較表達式或邏輯表達式,如果表達式為真,則執行“語句塊”;如果表達式的值為假,就跳 過“語句塊”,繼續執行後面的語句。 2、if…else語句if…else 語句基本用法: 使用 if…else 語句時,表達式可以是 ...
  • 總體原則:命名一定要體現其在程式中的作用; Camel命名法:第一個單詞的首字母小寫,其餘每個單詞的首字母大寫;多用給變數或者欄位命名;給欄位命名必須以下劃線開始; Pascal命名法:每個單詞的首字母都大寫,其餘字母小寫;適用於方法名、類名、屬性名等; ...
  • 一. 起始 去年.NetCore2.0的發佈,公司決定新項目採用.NetCore開發,當作試驗。但是問題在於當前公司內部使用的RPC服務為Thrift v0.9 + zookeeper版本,經過個性化定製,支持了非同步,但也因為如此,這麼多年來一直沒有去升級,導致遷移工作很複雜(歷史遺留項目太多,有各 ...
  • 前言 曾有做過一個產品,有一個功能是視頻監控模塊,視頻監控首先想到的是視頻多畫面切換功能,由於前端是用WPF開發的,所以當時就做了一個多畫面切換組件,效果如下: 功能設計前提: 由於要使用海康大華天地偉業等視頻廠家的視頻,對接的方式是通過各個廠家提供的SDK(官網下載),由於播放視頻的時候需要傳遞控 ...
  • .NET 術語 1. AOT 預編譯器。與 JIT 類似,此編譯器還可將 IL 轉換為機器代碼。 與 JIT 編譯相比,AOT 編譯在應用程式執行前進行並且通常在不同電腦上執行。 由於在運行時 AOT 工具鏈不編譯,因此它們不需要最大程度地減少編譯所花費的時間。 這意味著它們可花更多的時間進行優化 ...
  • 1 .gz 1)壓縮 2)解壓縮: 註意:不能壓縮目錄!支持批量壓縮,源文件被替換成.gz結尾的文件。 2 .bz2 1)壓縮 2)解壓縮: 3)強制壓縮: 註意:不能壓縮目錄!支持批量壓縮,源文件被替換成.bz2結尾的文件。 3 .zip 1)壓縮 2)解壓縮 註意:可以壓縮目錄!支持批量壓縮,源 ...
  • VMware 安裝提示缺少MicrosoftRuntime DLL 問題解決辦法 剛剛安裝VMware失敗了試了好多辦法,在這總結一下。 下麵是程式的截圖 這是報錯信息 網上的解決方法: 當出現安裝失敗的提示時,不要將界面關閉,然後在運行視窗輸入 %temp% 然後會進如文件夾, 在文件夾里找到類似 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...