在Ubuntu下搭建Spark群集

来源:http://www.cnblogs.com/studyzy/archive/2016/12/20/6204620.html
-Advertisement-
Play Games

在前一篇文章中,我們已經搭建好了Hadoop的群集,接下來,我們就是需要基於這個Hadoop群集,搭建Spark的群集。由於前面已經做了大量的工作,所以接下來搭建Spark會簡單很多。 首先打開三個虛擬機,現在我們需要安裝Scala,因為Spark是基於Scala開發的,所以需要安裝Scala。在U ...


前一篇文章中,我們已經搭建好了Hadoop的群集,接下來,我們就是需要基於這個Hadoop群集,搭建Spark的群集。由於前面已經做了大量的工作,所以接下來搭建Spark會簡單很多。

首先打開三個虛擬機,現在我們需要安裝Scala,因為Spark是基於Scala開發的,所以需要安裝Scala。在Ubuntu下安裝Scala很簡單,我們只需要運行

sudo apt-get install scala

就可以安裝Scala了。

安裝完成後運行scala -version可以看到安裝的Scala的版本,我現在2.11版,安裝目錄是在/usr/share/scala-2.11 。

接下來下載Spark。到官方網站,找到最新版的Spark的下載地址,選擇Hadoop版本,

http://spark.apache.org/downloads.html

wget http://spark下載地址

當下載完畢後解壓文件:

tar xvf spark-2.0.2-bin-hadoop2.7.tgz

接下來我們需要將解壓的文件夾移動到指定目錄,因為之前我們Hadoop安裝到/usr/local/hadoop,所以我們也可以把Spark放在/usr/local/spark下:

sudo mv spark-2.0.2-bin-hadoop2.7 /usr/local/spark

進入spark文件夾下的conf文件夾,裡面有個spark-env.sh.template文件,是spark環境變數設置的目標,我們可以複製一個出來:

cp spark-env.sh.template spark-env.sh

然後編輯該文件

vi spark-env.sh

在文件的末尾我們添加上以下內容:

export SCALA_HOME=/usr/share/scala-2.11 
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 
export HADOOP_HOME=/usr/local/hadoop 
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop 
SPARK_MASTER_IP=master 
SPARK_LOCAL_DIRS=/usr/local/spark 
SPARK_DRIVER_MEMORY=1G 
export LD_LIBRARY_PATH=/usr/local/hadoop/lib/native/:$LD_LIBRARY_PATH

這裡的內容是根據我虛擬機的環境來的,如果安裝的版本和路徑不一樣,可以根據實際情況更改。

接下來設置slaves文件。

cp slaves.template slaves
vi slaves

將內容改為

slave01

slave02

Spark在一臺機器上就算配置完畢,接下來在另外兩台機器上也做一模一樣的配置即可。

啟動Spark

在master上,我們先啟動Hadoop,然後運行

/usr/local/spark/sbin/start-all.sh

便可啟動Spark。

運行jps看看Java進程:

2929 Master
2982 Jps
2294 SecondaryNameNode
2071 DataNode
1929 NameNode
2459 ResourceManager
2603 NodeManager

發現比Hadoop啟動的時候多了Master進程。

切換到slave01節點上,運行JPS,看看進程:

1889 Worker
1705 NodeManager
1997 Jps
1551 DataNode

這裡比Hadoop的時候多了一個Worker進程。說明我們的Spark群集已經啟動成功。

下麵訪問Spark的網站:

http://192.168.100.40:8080/

可以看到2個worker都啟動。

image

最後,我們運行一下Spark的示常式序:

/usr/local/spark/bin/run-example SparkPi 10 --slave01 local[2]

可以在結果中找到

Pi is roughly 3.14XXXXX

說明我們運行成功了。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 使用快遞100查詢介面實現 源碼地址:https://github.com/chenjie200280/weizhang 測試安裝包:http://files.cnblogs.com/files/ttsofts/weizhang.apk 1.查詢界面 2.查詢結果1 (有違章的信息) 3.查詢結果3 ...
  • 很多人會遇到 初次運行 react native run android的時候 gradle下載極慢,甚至會失敗的問題 如下圖 實際上這個問題好解決的 1. 首先 把對應版本的 下載到本地任意一個磁碟里 比如說我在到了 2. 然後拖拽 文件夾到 瀏覽器 就會得到 的訪問地址 後面加上文件名 得到 的 ...
  • 廢話不多說,直接上乾貨 14:13:23 事務 概括:事務是一種機制,一個操作序列,包含一組資料庫操作命令,並且把所有的命令作為一個整體一起 向系統提交或撤銷操作 請求。 事務的特性: 1.原子性:事務是一個完整的操作,事務的各元素都是不可分的(原子的)。事務中的一組命令要麼都執行,要麼都不執 行。 ...
  • 總體解釋: DML(data manipulation language): 它們是SELECT、UPDATE、INSERT、DELETE,就象它的名字一樣,這4條命令是用來對資料庫里的數據進行操作的語言 DDL(data definition language): DDL比DML要多,主要的命令有 ...
  • 問題 對於DBA或者其他運維人員來說授權一個賬戶的相同許可權給另一個賬戶是一個很普通的任務。但是隨著伺服器、資料庫、應用、使用人員地增加就變得很枯燥乏味又耗時費力的工作。那麼有什麼容易的辦法來實現這個任務嗎? 當然,作為非DBA在測試甚至開發環境也會遇到這種問題,要求授予所有伺服器資料庫的某個許可權給一 ...
  • 問題描述: 從網上下了5.7 的MySQL,在bin目錄下執行 start mysqld ,彈出個cmd視窗一閃就沒了,也看不清是什麼報錯。mysqld --install安裝了服務,也啟動不了。 處理步驟: 1、打開事件查看器檢查報錯信息 2、網上查了,都說如果是 linux 需要執行 mysql ...
  • 最簡單的意思就是在sql server中定義了一系列操作的的一個過程,只要調用他就可以完成相應的操作. 存儲過程定義: 將常用的或很複雜的工作,預先用SQL語句寫好並用一個指定的名稱存儲起來, 那麼以後要叫資料庫提供與已定義好的存儲過程的功能相同的服務時,只需調用execute,即可自動完成命令。 ...
  • 之前因為項目的原因需要使用Oracle資料庫,由於時間有限沒辦法從基礎開始學習,而且oracle操作的命令界面又太不友好,於是就找到了PL/SQL Developer這個很好用的軟體來間接使用資料庫。 下麵簡單介紹一下如何用這個軟體連接Oracle資料庫。 第一步 安裝Oracle Database ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...