Intellij IDEA連接Spark集群_ZenDei技術網路在線

Intellij IDEA連接Spark集群

-Advertisement-

1. 首先安裝Scala插件，File->Settings->Plugins，搜索出Scla插件，點擊Install安裝； 2. File->New Project->maven，新建一個Maven項目，填寫GroupId和ArtifactId； 3. 編輯pom.xml文件，添加項目所需要的依賴： ...

1. 首先安裝Scala插件，File->Settings->Plugins，搜索出Scla插件，點擊Install安裝；

2. File->New Project->maven，新建一個Maven項目，填寫GroupId和ArtifactId；

3. 編輯pom.xml文件，添加項目所需要的依賴：

    <properties>
        <scala.version>2.10.5</scala.version>
        <hadoop.version>2.6.5</hadoop.version>
    </properties>

    <repositories>
        <repository>
            <id>scala-tools.org</id>
            <name>Scala-Tools Maven2 Repository</name>
            <url>http://scala-tools.org/repo-releases</url>
        </repository>
    </repositories>

    <dependencies>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.10</artifactId>
            <version>1.6.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_2.10</artifactId>
            <version>1.6.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_2.10</artifactId>
            <version>1.6.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>${hadoop.version}</version>
        </dependency>

    </dependencies>

4. File->Project Structure->Libraries，選擇和Spark運行環境一致的Scala版本：

5. File->Project Structure->Modules，在src/main/下麵增加一個scala文件夾，並且設置成source文件夾；

6. 在scala文件夾下麵新建一個scala文件SparkPi：

import scala.math.random
import org.apache.spark._

object SparkPi {
  def main(args: Array[String]) {
    val conf = new SparkConf().setAppName("Spark Pi").setMaster("spark://master:7077").setJars(Seq("E:\\Intellij\\Projects\\SparkExample\\SparkExample.jar"))
    val spark = new SparkContext(conf)
    val slices = if (args.length > 0) args(0).toInt else 2
    println("Time:" + spark.startTime)
    val n = math.min(1000L * slices, Int.MaxValue).toInt // avoid overflow
    val count = spark.parallelize(1 until n, slices).map { i =>
      val x = random * 2 - 1
      val y = random * 2 - 1
      if (x*x + y*y < 1) 1 else 0
    }.reduce(_ + _)
    println("Pi is roughly " + 4.0 * count / n)
    spark.stop()
  }
}

7. File->Project Structure->Artifacts，新建一個Jar->From modules with dependencies...，選擇Main Class：

設置Output directory，刪掉不必要的jar：

7. Build->Build Artifacts...，生成jar，然後再運行，成功！

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

SQLyog-12.4.2版下載，SQLyog最新版下載，SQLyog官網下載，SQLyog Download

SQLyog-12.4.2版下載，SQLyog最新版下載，SQLyog官網下載，SQLyog Download >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> ©Copyright 蕃薯耀 2017年5月19日 http://www.cnblogs.com/fanshuyao/ 註 ...
MySQL學習實踐---DISTINCT使用

表中某列有時包含重覆值，需要取出此列中的所有不同值時，就可以使用DISTINCT關鍵字用法：SELECT DISTINCT column_1,column_2 FROM table_name; 註意：1.DISTINCT只對column_1有效，其後的column_2即使有重覆值也無效 2.其它列 ...
Neo4j 第一篇：在Windows環境中安裝Neo4j

圖形資料庫（Graph Database）是NoSQL資料庫家族中特殊的存在，用於存儲豐富的關係數據，Neo4j 是目前最流行的圖形資料庫，支持完整的事務，在屬性圖中，圖是由頂點（Vertex），邊（Edge）和屬性（Property）組成的，頂點和邊都可以設置屬性，頂點也稱作節點，邊也稱作關係，每 ...
用scikit-learn估計值分類——近鄰演算法（KNN）

用scikit-learn估計值分類主要是為數據挖掘搭建通用的框架。有了這個框架之後，增加了演算法的泛化性，減少了數據挖掘的複雜性。用scikit-learn估計值分類有這三個方面： 1. 估計器（estimator）：用於分類、聚類和回歸分析。 2. 轉換器（transformer）：用於數據的預 ...
mysql資料庫基礎（待更）

什麼是資料庫？電腦處理和存儲的一切信息都是數據。電腦系統中一種用於存儲數據的程式。一種：電腦系統中有很多種能夠存取數據的程式。他們各有特長和長處，有自己的適用範圍。存取：能夠保存數據避免丟失。能夠按照需求找到符合條件的數據。為什麼要使用資料庫？較大數據量，事務控制，網路訪問，持 ...
SQL Server on Red Hat Enterprise Linux——RHEL上的SQL Server（全截圖）

本文從零開始一步一步介紹如何在Red Hat Enterprise Linux上搭建SQL Server 2017，包括安裝系統、安裝SQL等相關步驟和方法（僅供測試學習之用，基礎篇）。一．創建RHEL系統（Create Red Hat Enterprise Linux System） 1. 前 ...
java.lang.ClassNotFoundException: SparkPi$$anonfun$1

出現這個錯誤可能有兩種情況，Jar文件沒有傳上去，或者Build Path裡面包含的Jar文件和Spark的運行環境有衝突。對於第一種情況，需要在SparkConf語句後面加上Jar文件的路徑：對於第二種情況，需要把Build Path裡面的Jar文件刪除，因為Spark運行環境已經有這些文件了 ...
安裝虛擬機

1、安裝vmware Workstation VMware現在已經到了 12Pro的版本了，百度下載一個最新的版本就可以了，秘鑰也是很簡單的，一搜就出來了。 1、雙擊安裝包，進行安裝 VMware就是一個普通軟體，傻瓜式安裝就可以了，全部預設設置，也可以根據自己需要更改，這裡就不在介紹了。 2、安裝 ...