Spark的運行模式(2)--Yarn-Cluster和Yarn-Client

-Advertisement-

3. Yarn-Cluster Yarn是一種統一資源管理機制，可以在上面運行多種計算框架。Spark on Yarn模式分為兩種：Yarn-Cluster和Yarn-Client，前者Driver運行在Worker節點，後者Driver運行在Client節點上。採用Spark on Yarn模式， ...

3. Yarn-Cluster

Yarn是一種統一資源管理機制，可以在上面運行多種計算框架。Spark on Yarn模式分為兩種：Yarn-Cluster和Yarn-Client，前者Driver運行在Worker節點，後者Driver運行在Client節點上。採用Spark on Yarn模式，只需要在一個節點部署Spark就行了，因此部署比較簡單。

先介紹一下Yarn-Cluster。

首先把spark-assembly-1.6.0-hadoop2.6.0.jar上傳到HDFS。

由於Yarn在安裝Hadoop的時候已經配置了，所以就直接對Spark進行配置了。spark-env.sh在部署Standalone模式是已經設置了，所以也不需要在設置。這裡只需要在Master節點設置spark-defaults.conf，該文件在${HADOOP_HOME}/conf目錄下，增加以下設置：

spark.master                         spark://master:7077
spark.yarn.jar                　　　　 hdfs://master:9000/spark/jars/spark-assembly-1.6.0-hadoop2.6.0.jar
spark.eventLog.enabled                true
spark.eventLog.dir            　　　　 hdfs://master:9000/spark/logs
spark.serializer                      org.apache.spark.serializer.KryoSerializer
spark.driver.memory                   1g
spark.yarn.scheduler.heartbeat.intervals-ms            5000            
spark.yarn.preserve.staging.files                      false
spark.yarn.max.executor.failures                       6
spark.driver.extraJavaOptions -Dhdp.version=2.6.5
spark.yarn.am.extraJavaOptions -Dhdp.version=2.6.5

Spark on Yarn不需要啟動Spark的Master或者Slave，只需要啟動Hadoop的DFS和Yarn就行了，也就是只需要運行Hadoop的start-all.sh就行了，因此運行也相對簡單，並且性能還比較好。

啟動Hadoop的DFS和Yarn以後，運行：

其中的 --master yarn-cluster表明以Yarn-Cluster模式運行。運行結束以後可以Master:8080看到這個Application：

點進Logs可以看見運行結果：

3. Yarn-Client

Yarn-Client的部署和Yarn-Cluster是一樣的，區別就在於Yarn-Cluster的Driver運行在Worker節點，而Yarn-Client的Driver運行在Client節點。

輸入命令：

其中--master yarn-client表明以Yarn-Client模式運行。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

MySQL : 資料庫和表的基本操作總結

針對database和table的操作大致可分為三類：創建，查詢，修改，刪除 1. 創建 create ①創建資料庫 create database db_name; ②創建表 create table db_name.tb_name (列的屬性) [表選項]; tip : 必須指明所屬的資料庫（也 ...
PL/SQL database character set(AL32UTF8) and Client character set(ZHS16GBK) are different

轉自：http://blog.163.com/magicc_love/blog/static/18585366220123111128283/ 修改部分為紅色部分，原作者寫錯了啟動PL/SQL Developer 報字元編碼不一致錯誤 Database character set (AL32UTF ...
用Docker在一臺筆記本電腦上搭建一個具有10個節點7種角色的Hadoop集群（下）-搭建Hadoop集群

上篇：用Docker在一臺筆記本電腦上搭建一個具有10個節點7種角色的Hadoop集群（上）-快速上手Docker 上篇介紹了快速上手Docker部分，下麵接著介紹搭建Hadoop集群部分。六、搭建Hadoop偽分佈模式我們先用前面創建的這個容器來搭建Hadoop偽分佈模式做測試，測試成功後再搭 ...
informix資料庫的日誌

看到一句sql，沒見過：經過百度，找到如下解釋： ...
SQL必知必會 -------- 聚集函數、分組排序

聚集函數 1.AVG()函數輸入：SELECT AVG(prod_price) AS avg_price FROM Products 輸出：警告：只用於單個列AVG()只能用來確定特定數值列的平均值，而且列名必須作為函數參數給出。為了獲得多個列的平均值，必須使用多個AVG()函數。說明：NULL ...
Powerpivot PowerBI相關組件下載安裝（附操作截圖）

載入方式：com載入項載入方法：點擊Excel界面【文件】→【選項】→【載入項】→【COM載入項】→【轉到】 Excel2013載入PowerView Excel216PowerQuery不需要載入，在數據標簽下： 16載入完成界面 PowerPivot 說明：13、16版本集成 10版下載地址： ...
.Net程式員學用Oracle系列(26)：PLSQL 之類型、變數和結構

" 1、類型 " "1.1、屬性類型" "1.2、記錄類型" " 2、變數 " "2.1、變數類型" "2.2、變數定義" "2.3、變數賦值" " 3、結構 " "3.1、順序結構" "3.2、選擇結構" "3.3、迴圈結構" " 4、總結 " 1、類型在 "《.Net程式員學用Oracle系列 ...
MySQL亂碼

摘要： 1、在mysql中執行下句成功，可添加中文的。insert into book(bookName,author,publish) values('好','hao','hao'); 但是在jsp中執行這個insert 語句就會出現亂碼。 1、在mysql中執行下句成功，可添加中文的。 inse ...