Scala當中parallelize並行化的用法

-Advertisement-

[學習筆記] parallelize並行化集合是根據一個已經存在的Scala集合創建的RDD對象。集合的裡面的元素將會被拷貝進入新創建出的一個可被並行操作的分散式數據集。例如：val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5)) 根據系統環境來進行切分多個s ...

[學習筆記]

parallelize並行化集合是根據一個已經存在的Scala集合創建的RDD對象。集合的裡面的元素將會被拷貝進入新創建出的一個可被並行操作的分散式數據集。
例如：val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5)) 根據系統環境來進行切分多個slice，每一個slice啟動一個Task來進行處理。
val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5), 5) 指定了partition的數量為5,
makeRDD和parallelize的區別？makeRDD函數有兩種實現，第一種實現其實完全和parallelize一致。而第二種實現可以為數據提供位置信息，除此之外，和parallelize是一致的
*/
    val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5), 3)
    val rdd03_1 = rdd03.map { x => x + 1 }
    println("map2 用法 is 馬克-to-win @ 馬克java社區：" + rdd03_1.collect().mkString(","))

    val rdd04 = sc.parallelize(List(1, 4, 3, 7, 5), 3)
    val rdd04_1 = rdd04.filter { x => x > 3 }
    println("filter2 用法馬克-to-win @ 馬克java社區：" + rdd04_1.collect().mkString(","))

    val rdd05: RDD[Int] = sc.makeRDD(Array(1, 4, 3))
    val rdd06: RDD[Int] = sc.makeRDD(Array(7, 5))
    myunion(rdd05, rdd06)
    /*reduce(function)

文章轉載自原文：https://blog.csdn.net/qq_44596980/article/details/93310016

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Linux的吉祥物

名叫Tux ...
Linux網站

Linux內核網站: "https://www.kernel.org/" Redhat官網: "https://www.redhat.com/en" SUSE官網: "https://www.suse.com/" Centos官網: "https://centos.org/" Debian官網: " ...
linux常用命令-1系統相關命令

hostname #電腦名 passwd #修改密碼 reboot #重啟 shutdown –r now #立刻重啟（root用戶使用） shutdown –r 10 #過10分鐘自動重啟（root用戶使用） shutdown –r 18:00 #在時間為18:00的時候重啟（root用戶使用） ...
man -k, man -f : nothing appropriate ; 更新 whatis 資料庫

man 有兩個選項：當我們使用的時候，如果沒有建立whatis 資料庫就會出現 nothing appropriate 的信息；我們可以使用 makewhatis 來更新；當然也可以使用 mandb 命令：之後你就可以進行使用關鍵字進行搜索了；簡單記錄，防止遺忘；如果對您有幫助，請點擊推 ...
我的黑蘋果之路 9400f + msi b360 mortar + 1050ti

硬體配置： CPU：i5 9400f 主板：微型msi迫擊炮B360 記憶體：威剛 ddr4 8g 2133 *2 顯卡：技嘉1050ti 4g 顯示器：koiso 4K （使用的dp介面連接，hdmi介面直接黑屏）硬碟：海康視威c2000 256g + 三星256G固態（裝win10）藍牙接收器 ...
Centos7 搭建owncloud雲存儲

使用CentOS7搭建OwnCloud私有雲(LAMP環境)，不關閉SELinux。 ...
Linux 常用命令（根據自己的理解隨時更新）

1. linux 目錄解釋系統啟動必須： /boot：存放的啟動 Linux 時使用的內核文件，包括連接文件以及鏡像文件。 /etc：存放所有的系統需要的配置文件和子目錄列表，更改目錄下的文件可能會導致系統不能啟動。 /lib：存放基本的動態連接共用庫（比如c++庫），其作用類似於Windows里的 ...
mysql學習之基礎篇01

大概在一周前看了燕十八老師講解的mysql資料庫視頻，也跟著學了一周，我就想把我這一周所學的知識跟大家分享一下；因為是第一次寫博客，所以可能會寫的很爛，請大家多多包涵。文章中有不對的地方還請大家指出來，我會加以改正。我們先來學習對資料庫進行連接並且對錶進行最基本的增刪改查：先來進行對資料庫伺服器 ...