Scala當中parallelize並行化的用法

来源:https://www.cnblogs.com/haima1949/archive/2019/07/27/11256267.html
-Advertisement-
Play Games

[學習筆記] parallelize並行化集合是根據一個已經存在的Scala集合創建的RDD對象。集合的裡面的元素將會被拷貝進入新創建出的一個可被並行操作的分散式數據集。例如:val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5)) 根據系統環境來進行切分多個s ...


[學習筆記]

parallelize並行化集合是根據一個已經存在的Scala集合創建的RDD對象。集合的裡面的元素將會被拷貝進入新創建出的一個可被並行操作的分散式數據集。
例如:val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5)) 根據系統環境來進行切分多個slice,每一個slice啟動一個Task來進行處理。
val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5), 5) 指定了partition的數量為5,
makeRDD和parallelize的區別?makeRDD函數有兩種實現,第一種實現其實完全和parallelize一致。而第二種實現可以為數據提供位置信息,除此之外,和parallelize是一致的
 */
    val rdd03 = sc.parallelize(List(1, 4, 3, 7, 5), 3)
    val rdd03_1 = rdd03.map { x => x + 1 }
    println("map2 用法  is 馬克-to-win @ 馬克java社區:" + rdd03_1.collect().mkString(","))

    val rdd04 = sc.parallelize(List(1, 4, 3, 7, 5), 3)
    val rdd04_1 = rdd04.filter { x => x > 3 }
    println("filter2 用法 馬克-to-win @ 馬克java社區:" + rdd04_1.collect().mkString(","))

    val rdd05: RDD[Int] = sc.makeRDD(Array(1, 4, 3))
    val rdd06: RDD[Int] = sc.makeRDD(Array(7, 5))
    myunion(rdd05, rdd06)
    /*reduce(function)

文章轉載自原文:https://blog.csdn.net/qq_44596980/article/details/93310016


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 名叫Tux ...
  • Linux內核網站: "https://www.kernel.org/" Redhat官網: "https://www.redhat.com/en" SUSE官網: "https://www.suse.com/" Centos官網: "https://centos.org/" Debian官網: " ...
  • hostname #電腦名 passwd #修改密碼 reboot #重啟 shutdown –r now #立刻重啟(root用戶使用) shutdown –r 10 #過10分鐘自動重啟(root用戶使用) shutdown –r 18:00 #在時間為18:00的時候重啟(root用戶使用) ...
  • man 有兩個選項: 當我們使用的時候,如果沒有建立whatis 資料庫 就會出現 nothing appropriate 的信息; 我們可以使用 makewhatis 來更新; 當然也可以使用 mandb 命令: 之後你就可以進行使用關鍵字進行搜索了; 簡單記錄,防止遺忘;如果對您有幫助,請點擊推 ...
  • 硬體配置: CPU:i5 9400f 主板:微型msi迫擊炮B360 記憶體:威剛 ddr4 8g 2133 *2 顯卡:技嘉1050ti 4g 顯示器:koiso 4K (使用的dp介面連接,hdmi介面直接黑屏) 硬碟:海康視威c2000 256g + 三星256G固態(裝win10) 藍牙接收器 ...
  • 使用CentOS7搭建OwnCloud私有雲(LAMP環境),不關閉SELinux。 ...
  • 1. linux 目錄解釋系統啟動必須: /boot:存放的啟動 Linux 時使用的內核文件,包括連接文件以及鏡像文件。 /etc:存放所有的系統需要的配置文件和子目錄列表,更改目錄下的文件可能會導致系統不能啟動。 /lib:存放基本的動態連接共用庫(比如c++庫),其作用類似於Windows里的 ...
  • 大概在一周前看了燕十八老師講解的mysql資料庫視頻,也跟著學了一周,我就想把我這一周所學的知識跟大家分享一下;因為是第一次寫博客,所以可能會寫的很爛,請大家多多包涵。文章中有不對的地方還請大家指出來,我會加以改正。 我們先來學習對資料庫進行連接並且對錶進行最基本的增刪改查: 先來進行對資料庫伺服器 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...