Intellij IDEA連接Spark集群

来源:http://www.cnblogs.com/mstk/archive/2017/05/18/6875068.html
-Advertisement-
Play Games

1. 首先安裝Scala插件,File->Settings->Plugins,搜索出Scla插件,點擊Install安裝; 2. File->New Project->maven,新建一個Maven項目,填寫GroupId和ArtifactId; 3. 編輯pom.xml文件,添加項目所需要的依賴: ...


1. 首先安裝Scala插件,File->Settings->Plugins,搜索出Scla插件,點擊Install安裝;

2. File->New Project->maven,新建一個Maven項目,填寫GroupId和ArtifactId;

3. 編輯pom.xml文件,添加項目所需要的依賴:

    <properties>
        <scala.version>2.10.5</scala.version>
        <hadoop.version>2.6.5</hadoop.version>
    </properties>

    <repositories>
        <repository>
            <id>scala-tools.org</id>
            <name>Scala-Tools Maven2 Repository</name>
            <url>http://scala-tools.org/repo-releases</url>
        </repository>
    </repositories>

    <dependencies>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.10</artifactId>
            <version>1.6.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_2.10</artifactId>
            <version>1.6.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_2.10</artifactId>
            <version>1.6.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>${hadoop.version}</version>
        </dependency>

    </dependencies>

4. File->Project Structure->Libraries,選擇和Spark運行環境一致的Scala版本:

5. File->Project Structure->Modules,在src/main/下麵增加一個scala文件夾,並且設置成source文件夾;

6. 在scala文件夾下麵新建一個scala文件SparkPi:


import scala.math.random
import org.apache.spark._

object SparkPi {
def main(args: Array[String]) {
val conf = new SparkConf().setAppName("Spark Pi").setMaster("spark://master:7077").setJars(Seq("E:\\Intellij\\Projects\\SparkExample\\SparkExample.jar"))
val spark = new SparkContext(conf)
val slices = if (args.length > 0) args(0).toInt else 2
println("Time:" + spark.startTime)
val n = math.min(1000L * slices, Int.MaxValue).toInt // avoid overflow
val count = spark.parallelize(1 until n, slices).map { i =>
val x = random * 2 - 1
val y = random * 2 - 1
if (x*x + y*y < 1) 1 else 0
}.reduce(_ + _)
println("Pi is roughly " + 4.0 * count / n)
spark.stop()
}
}
 

7. File->Project Structure->Artifacts,新建一個Jar->From modules with dependencies...,選擇Main Class:

設置Output directory,刪掉不必要的jar:

7. Build->Build Artifacts...,生成jar,然後再運行,成功!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • SQLyog-12.4.2版下載,SQLyog最新版下載,SQLyog官網下載,SQLyog Download >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> ©Copyright 蕃薯耀 2017年5月19日 http://www.cnblogs.com/fanshuyao/ 註 ...
  • 表中某列有時包含重覆值,需要取出此列中的所有不同值時,就可以使用DISTINCT關鍵字 用法:SELECT DISTINCT column_1,column_2 FROM table_name; 註意:1.DISTINCT只對column_1有效,其後的column_2即使有重覆值也無效 2.其它列 ...
  • 圖形資料庫(Graph Database)是NoSQL資料庫家族中特殊的存在,用於存儲豐富的關係數據,Neo4j 是目前最流行的圖形資料庫,支持完整的事務,在屬性圖中,圖是由頂點(Vertex),邊(Edge)和屬性(Property)組成的,頂點和邊都可以設置屬性,頂點也稱作節點,邊也稱作關係,每 ...
  • 用scikit-learn估計值分類主要是為數據挖掘搭建通用的框架。有了這個框架之後,增加了演算法的泛化性,減少了數據挖掘的複雜性。 用scikit-learn估計值分類有這三個方面: 1. 估計器(estimator):用於分類、聚類和回歸分析。 2. 轉換器(transformer):用於數據的預 ...
  • 什麼是資料庫? 電腦處理和存儲的一切信息都是數據。 電腦系統中一種用於存儲數據的程式。 一種:電腦系統中有很多種能夠存取數據的程式。 他們各有特長和長處,有自己的適用範圍。 存取:能夠保存數據避免丟失。 能夠按照需求找到符合條件的數據。 為什麼要使用資料庫? 較大數據量,事務控制,網路訪問,持 ...
  • 本文從零開始一步一步介紹如何在Red Hat Enterprise Linux上搭建SQL Server 2017,包括安裝系統、安裝SQL等相關步驟和方法(僅供測試學習之用,基礎篇)。 一. 創建RHEL系統(Create Red Hat Enterprise Linux System) 1. 前 ...
  • 出現這個錯誤可能有兩種情況,Jar文件沒有傳上去,或者Build Path裡面包含的Jar文件和Spark的運行環境有衝突。 對於第一種情況,需要在SparkConf語句後面加上Jar文件的路徑: 對於第二種情況,需要把Build Path裡面的Jar文件刪除,因為Spark運行環境已經有這些文件了 ...
  • 1、安裝vmware Workstation VMware現在已經到了 12Pro的版本了,百度下載一個最新的版本就可以了,秘鑰也是很簡單的,一搜就出來了。 1、雙擊安裝包,進行安裝 VMware就是一個普通軟體,傻瓜式安裝就可以了,全部預設設置,也可以根據自己需要更改,這裡就不在介紹了。 2、安裝 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...