Spark機器學習(7):KMenas演算法

来源:http://www.cnblogs.com/mstk/archive/2017/07/11/7151943.html
-Advertisement-
Play Games

KMenas演算法比較簡單,不詳細介紹了,直接上代碼。 運行結果: ...


KMenas演算法比較簡單,不詳細介紹了,直接上代碼。

import org.apache.log4j.{Level, Logger}
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.clustering._

/**
  * Created by Administrator on 2017/7/11.
  */
object Kmenas {

  def main(args:Array[String]): Unit ={
    // 設置運行環境
    val conf = new SparkConf().setAppName("KMeans Test")
      .setMaster("spark://master:7077").setJars(Seq("E:\\Intellij\\Projects\\MachineLearning\\MachineLearning.jar"))
    val sc = new SparkContext(conf)
    Logger.getRootLogger.setLevel(Level.WARN)

    // 讀取樣本數據並解析
    val data = sc.textFile("hdfs://master:9000/ml/data/kmeans_data.txt")
    val parsedData = data.map(s => Vectors.dense(s.split(' ').map(_.toDouble))).cache()

    // 新建KMeans聚類模型並訓練
    val initMode = "k-means||"
    val numClusters = 2
    val numIterations = 500
    val model = new KMeans().
      setInitializationMode(initMode).
      setK(numClusters).
      setMaxIterations(numIterations).
      run(parsedData)
    val centers = model.clusterCenters
    println("Centers:")
    for (i <- 0 to centers.length - 1) {
      println(centers(i)(0) + "\t" + centers(i)(1))
    }

    // 誤差計算
    val Error = model.computeCost(parsedData)
    println("Errors = " + Error)

  }

}

運行結果:


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、設置導航欄標題的字體顏色和大小 方法一:(自定義視圖的方法,一般人也會採用這樣的方式) 就是在導航向上添加一個titleView,可以使用一個label,再設置label的背景顏色透明,字體什麼的設置就很簡單了。 //自定義標題視圖 UILabel *titleLabel = [[UILabel ...
  • setContenView(R.id.activity)實現原理 1.底層框架根據佈局ID找到佈局文件。 2.底層框架解析此佈局文件(pull解析)。 3.底層框架通過反射構建佈局文件中的元素對象(EditText,TextView等)。 4.底層框架會將元素對象(view)放到Activity中。 ...
  • 一,代碼。 二,輸出。 ...
  • 1 概述 1 概述 1.1 已發佈【SqlServer系列】文章 【SqlServer系列】SQLSERVER安裝教程 【SqlServer系列】資料庫三大範式 【SqlServer系列】表單查詢 1.2 本篇文章內容概要 1.3 本篇文章內容概括 在SQL語句中,關於表連接,若按照表的數量來劃分, ...
  • MySQL配置文件 MySQL軟體使用的配置文件名為my.ini,在安裝目錄下。 MySQL常用配置參數: 1.default-character-set:客戶端預設字元集。 2.character-set-server:伺服器端預設字元集。 3.port:客戶端和伺服器端的埠號。 4.defau ...
  • 我們首先看一下自己的環境: MHA已經搭建: master:172.16.16.35:3306 slave:172.16.16.35:3307 slave:172.16.16.34:3307 MHA manager在172.16.16.34,配置文件如下: MHA manager在172.16.16 ...
  • 環境及測試 使用.net驅動npgsql連接post資料庫。配置:win10 x64, i5 4590, 16G DDR3, SSD 850EVO. postgresql 9.6.3,資料庫與數據都安裝在SSD上,預設配置,無擴展。 1. 導入 使用數據備份,csv格式導入,文件位於機械硬碟上,48 ...
  • 1.windows上下載安裝sbt 去sbt官網下載 sbt包,解壓到指定目錄,不需要安裝。記得配置環境變數。 新建 SBT_HOME ,值是sbt包的解壓路徑,比如C:\Users\***\Tools\sbt-0.13.15\sbt(建議不要放在C盤) 併在path 中添加 %SBT_HOME%\ ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...