在Ubuntu下搭建Spark群集

来源:http://www.cnblogs.com/studyzy/archive/2016/12/20/6204620.html
-Advertisement-
Play Games

在前一篇文章中,我們已經搭建好了Hadoop的群集,接下來,我們就是需要基於這個Hadoop群集,搭建Spark的群集。由於前面已經做了大量的工作,所以接下來搭建Spark會簡單很多。 首先打開三個虛擬機,現在我們需要安裝Scala,因為Spark是基於Scala開發的,所以需要安裝Scala。在U ...


前一篇文章中,我們已經搭建好了Hadoop的群集,接下來,我們就是需要基於這個Hadoop群集,搭建Spark的群集。由於前面已經做了大量的工作,所以接下來搭建Spark會簡單很多。

首先打開三個虛擬機,現在我們需要安裝Scala,因為Spark是基於Scala開發的,所以需要安裝Scala。在Ubuntu下安裝Scala很簡單,我們只需要運行

sudo apt-get install scala

就可以安裝Scala了。

安裝完成後運行scala -version可以看到安裝的Scala的版本,我現在2.11版,安裝目錄是在/usr/share/scala-2.11 。

接下來下載Spark。到官方網站,找到最新版的Spark的下載地址,選擇Hadoop版本,

http://spark.apache.org/downloads.html

wget http://spark下載地址

當下載完畢後解壓文件:

tar xvf spark-2.0.2-bin-hadoop2.7.tgz

接下來我們需要將解壓的文件夾移動到指定目錄,因為之前我們Hadoop安裝到/usr/local/hadoop,所以我們也可以把Spark放在/usr/local/spark下:

sudo mv spark-2.0.2-bin-hadoop2.7 /usr/local/spark

進入spark文件夾下的conf文件夾,裡面有個spark-env.sh.template文件,是spark環境變數設置的目標,我們可以複製一個出來:

cp spark-env.sh.template spark-env.sh

然後編輯該文件

vi spark-env.sh

在文件的末尾我們添加上以下內容:

export SCALA_HOME=/usr/share/scala-2.11 
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 
export HADOOP_HOME=/usr/local/hadoop 
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop 
SPARK_MASTER_IP=master 
SPARK_LOCAL_DIRS=/usr/local/spark 
SPARK_DRIVER_MEMORY=1G 
export LD_LIBRARY_PATH=/usr/local/hadoop/lib/native/:$LD_LIBRARY_PATH

這裡的內容是根據我虛擬機的環境來的,如果安裝的版本和路徑不一樣,可以根據實際情況更改。

接下來設置slaves文件。

cp slaves.template slaves
vi slaves

將內容改為

slave01

slave02

Spark在一臺機器上就算配置完畢,接下來在另外兩台機器上也做一模一樣的配置即可。

啟動Spark

在master上,我們先啟動Hadoop,然後運行

/usr/local/spark/sbin/start-all.sh

便可啟動Spark。

運行jps看看Java進程:

2929 Master
2982 Jps
2294 SecondaryNameNode
2071 DataNode
1929 NameNode
2459 ResourceManager
2603 NodeManager

發現比Hadoop啟動的時候多了Master進程。

切換到slave01節點上,運行JPS,看看進程:

1889 Worker
1705 NodeManager
1997 Jps
1551 DataNode

這裡比Hadoop的時候多了一個Worker進程。說明我們的Spark群集已經啟動成功。

下麵訪問Spark的網站:

http://192.168.100.40:8080/

可以看到2個worker都啟動。

image

最後,我們運行一下Spark的示常式序:

/usr/local/spark/bin/run-example SparkPi 10 --slave01 local[2]

可以在結果中找到

Pi is roughly 3.14XXXXX

說明我們運行成功了。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 使用快遞100查詢介面實現 源碼地址:https://github.com/chenjie200280/weizhang 測試安裝包:http://files.cnblogs.com/files/ttsofts/weizhang.apk 1.查詢界面 2.查詢結果1 (有違章的信息) 3.查詢結果3 ...
  • 很多人會遇到 初次運行 react native run android的時候 gradle下載極慢,甚至會失敗的問題 如下圖 實際上這個問題好解決的 1. 首先 把對應版本的 下載到本地任意一個磁碟里 比如說我在到了 2. 然後拖拽 文件夾到 瀏覽器 就會得到 的訪問地址 後面加上文件名 得到 的 ...
  • 廢話不多說,直接上乾貨 14:13:23 事務 概括:事務是一種機制,一個操作序列,包含一組資料庫操作命令,並且把所有的命令作為一個整體一起 向系統提交或撤銷操作 請求。 事務的特性: 1.原子性:事務是一個完整的操作,事務的各元素都是不可分的(原子的)。事務中的一組命令要麼都執行,要麼都不執 行。 ...
  • 總體解釋: DML(data manipulation language): 它們是SELECT、UPDATE、INSERT、DELETE,就象它的名字一樣,這4條命令是用來對資料庫里的數據進行操作的語言 DDL(data definition language): DDL比DML要多,主要的命令有 ...
  • 問題 對於DBA或者其他運維人員來說授權一個賬戶的相同許可權給另一個賬戶是一個很普通的任務。但是隨著伺服器、資料庫、應用、使用人員地增加就變得很枯燥乏味又耗時費力的工作。那麼有什麼容易的辦法來實現這個任務嗎? 當然,作為非DBA在測試甚至開發環境也會遇到這種問題,要求授予所有伺服器資料庫的某個許可權給一 ...
  • 問題描述: 從網上下了5.7 的MySQL,在bin目錄下執行 start mysqld ,彈出個cmd視窗一閃就沒了,也看不清是什麼報錯。mysqld --install安裝了服務,也啟動不了。 處理步驟: 1、打開事件查看器檢查報錯信息 2、網上查了,都說如果是 linux 需要執行 mysql ...
  • 最簡單的意思就是在sql server中定義了一系列操作的的一個過程,只要調用他就可以完成相應的操作. 存儲過程定義: 將常用的或很複雜的工作,預先用SQL語句寫好並用一個指定的名稱存儲起來, 那麼以後要叫資料庫提供與已定義好的存儲過程的功能相同的服務時,只需調用execute,即可自動完成命令。 ...
  • 之前因為項目的原因需要使用Oracle資料庫,由於時間有限沒辦法從基礎開始學習,而且oracle操作的命令界面又太不友好,於是就找到了PL/SQL Developer這個很好用的軟體來間接使用資料庫。 下麵簡單介紹一下如何用這個軟體連接Oracle資料庫。 第一步 安裝Oracle Database ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...