Spark機器學習(7)：KMenas演算法

-Advertisement-

KMenas演算法比較簡單，不詳細介紹了，直接上代碼。運行結果： ...

KMenas演算法比較簡單，不詳細介紹了，直接上代碼。

import org.apache.log4j.{Level, Logger}
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.clustering._

/**
  * Created by Administrator on 2017/7/11.
  */
object Kmenas {

  def main(args:Array[String]): Unit ={
    // 設置運行環境
    val conf = new SparkConf().setAppName("KMeans Test")
      .setMaster("spark://master:7077").setJars(Seq("E:\\Intellij\\Projects\\MachineLearning\\MachineLearning.jar"))
    val sc = new SparkContext(conf)
    Logger.getRootLogger.setLevel(Level.WARN)

    // 讀取樣本數據並解析
    val data = sc.textFile("hdfs://master:9000/ml/data/kmeans_data.txt")
    val parsedData = data.map(s => Vectors.dense(s.split(' ').map(_.toDouble))).cache()

    // 新建KMeans聚類模型並訓練
    val initMode = "k-means||"
    val numClusters = 2
    val numIterations = 500
    val model = new KMeans().
      setInitializationMode(initMode).
      setK(numClusters).
      setMaxIterations(numIterations).
      run(parsedData)
    val centers = model.clusterCenters
    println("Centers:")
    for (i <- 0 to centers.length - 1) {
      println(centers(i)(0) + "\t" + centers(i)(1))
    }

    // 誤差計算
    val Error = model.computeCost(parsedData)
    println("Errors = " + Error)

  }

}

運行結果：

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

OC 小代碼塊

1、設置導航欄標題的字體顏色和大小方法一：（自定義視圖的方法，一般人也會採用這樣的方式）就是在導航向上添加一個titleView，可以使用一個label，再設置label的背景顏色透明，字體什麼的設置就很簡單了。 //自定義標題視圖 UILabel *titleLabel = [[UILabel ...
Activity創建時佈局文件的實現原理

setContenView（R.id.activity）實現原理 1.底層框架根據佈局ID找到佈局文件。 2.底層框架解析此佈局文件（pull解析）。 3.底層框架通過反射構建佈局文件中的元素對象（EditText，TextView等）。 4.底層框架會將元素對象（view）放到Activity中。 ...
【代碼筆記】iOS-使用MD5加密

一，代碼。二，輸出。 ...
【SqlServer系列】表連接

1 概述 1 概述 1.1 已發佈【SqlServer系列】文章【SqlServer系列】SQLSERVER安裝教程【SqlServer系列】資料庫三大範式【SqlServer系列】表單查詢 1.2 本篇文章內容概要 1.3 本篇文章內容概括在SQL語句中，關於表連接，若按照表的數量來劃分， ...
MySQL手冊

MySQL配置文件 MySQL軟體使用的配置文件名為my.ini，在安裝目錄下。 MySQL常用配置參數： 1.default-character-set：客戶端預設字元集。 2.character-set-server：伺服器端預設字元集。 3.port：客戶端和伺服器端的埠號。 4.defau ...
ProxySQL讀寫分離

我們首先看一下自己的環境： MHA已經搭建： master：172.16.16.35:3306 slave：172.16.16.35:3307 slave：172.16.16.34:3307 MHA manager在172.16.16.34，配置文件如下： MHA manager在172.16.16 ...
Postgresql快速寫入/讀取大量數據（.net）

環境及測試使用.net驅動npgsql連接post資料庫。配置：win10 x64, i5 4590, 16G DDR3, SSD 850EVO. postgresql 9.6.3，資料庫與數據都安裝在SSD上，預設配置，無擴展。 1. 導入使用數據備份，csv格式導入，文件位於機械硬碟上，48 ...
spark極簡入門

1.windows上下載安裝sbt 去sbt官網下載 sbt包，解壓到指定目錄,不需要安裝。記得配置環境變數。新建 SBT_HOME ，值是sbt包的解壓路徑，比如C:\Users\***\Tools\sbt-0.13.15\sbt（建議不要放在C盤）併在path 中添加 %SBT_HOME%\ ...