spark極簡入門

来源:http://www.cnblogs.com/youza/archive/2017/07/11/7147379.html
-Advertisement-
Play Games

1.windows上下載安裝sbt 去sbt官網下載 sbt包,解壓到指定目錄,不需要安裝。記得配置環境變數。 新建 SBT_HOME ,值是sbt包的解壓路徑,比如C:\Users\***\Tools\sbt-0.13.15\sbt(建議不要放在C盤) 併在path 中添加 %SBT_HOME%\ ...


1.windows上下載安裝sbt

去sbt官網下載 sbt包,解壓到指定目錄,不需要安裝。記得配置環境變數。

新建 SBT_HOME ,值是sbt包的解壓路徑,比如C:\Users\***\Tools\sbt-0.13.15\sbt(建議不要放在C盤)

併在path 中添加 %SBT_HOME%\bin

查看是否成功,命令行輸入:  sbt sbtVersion 

2.在intellij idea中安裝Scala插件

File -->Settings-->Plugins-->Scala-->install

這樣就不用再本機安裝Scala了

3.新建SBT project

File-->new-->project-->scala-->SBT

 

 

-->Next

註意版本對應:

                  Scala 2.10 ---Java7                   Scala 2.12----java8

 可以在spark官網上查看,例如 spark 1.6.0:

  Spark runs on Java 7+, Python 2.6+ and R 3.1+. For the Scala API, Spark 1.6.0 uses Scala 2.10. You will need to use a compatible Scala version (2.10.x).

 

 

 

 -->finish.

4.編輯build.sbt

name := "sparkTest"

version := "1.0"

scalaVersion := "2.10.1"

libraryDependencies += "org.apache.spark" %% "spark-core" % "1.6.0" % "provided"

  

 5.簡單的word count 代碼

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
object App {
  def main(args:Array[String])={
    val logFile = "file:///home/hadoop/cy/README.md" // Should be some file on your system
    val conf = new SparkConf().setAppName("Simple Application")
    val sc = new SparkContext(conf)
    val logData = sc.textFile(logFile, 2).cache()
    val numAs = logData.filter(line => line.contains("a")).count()
    val numBs = logData.filter(line => line.contains("b")).count()
    println("Lines with a: %s, Lines with b: %s".format(numAs, numBs))
  }
} 

 5.打包運行

 命令行中進入project所在目錄下,執行sbt package ,生成的jar包會出現在: <project path>/target/scala-2.10/sparktest_2.10-1.0.jar 。將jar包傳到裝有spark 1.6.0的機器上,運行 ./bin/spark-submit sparktest_2.10-1.0.jar。

 

哈哈極簡試水版,歡迎糾錯指正~~~~~~

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 使用Intent在活動間穿梭(Intent不僅可以指明當前組件想要執行的動作,還可以在不同組件之間傳遞數據) 1、使用顯式Intent 基於安卓入門1的內容,繼續在ActivityTest項目中再創建一個活動。右擊com.example.administrator.activitytest包->Ne ...
  • 1、設置導航欄標題的字體顏色和大小 方法一:(自定義視圖的方法,一般人也會採用這樣的方式) 就是在導航向上添加一個titleView,可以使用一個label,再設置label的背景顏色透明,字體什麼的設置就很簡單了。 //自定義標題視圖 UILabel *titleLabel = [[UILabel ...
  • setContenView(R.id.activity)實現原理 1.底層框架根據佈局ID找到佈局文件。 2.底層框架解析此佈局文件(pull解析)。 3.底層框架通過反射構建佈局文件中的元素對象(EditText,TextView等)。 4.底層框架會將元素對象(view)放到Activity中。 ...
  • 一,代碼。 二,輸出。 ...
  • 1 概述 1 概述 1.1 已發佈【SqlServer系列】文章 【SqlServer系列】SQLSERVER安裝教程 【SqlServer系列】資料庫三大範式 【SqlServer系列】表單查詢 1.2 本篇文章內容概要 1.3 本篇文章內容概括 在SQL語句中,關於表連接,若按照表的數量來劃分, ...
  • MySQL配置文件 MySQL軟體使用的配置文件名為my.ini,在安裝目錄下。 MySQL常用配置參數: 1.default-character-set:客戶端預設字元集。 2.character-set-server:伺服器端預設字元集。 3.port:客戶端和伺服器端的埠號。 4.defau ...
  • 我們首先看一下自己的環境: MHA已經搭建: master:172.16.16.35:3306 slave:172.16.16.35:3307 slave:172.16.16.34:3307 MHA manager在172.16.16.34,配置文件如下: MHA manager在172.16.16 ...
  • 環境及測試 使用.net驅動npgsql連接post資料庫。配置:win10 x64, i5 4590, 16G DDR3, SSD 850EVO. postgresql 9.6.3,資料庫與數據都安裝在SSD上,預設配置,無擴展。 1. 導入 使用數據備份,csv格式導入,文件位於機械硬碟上,48 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...