scala 函數式編程之集合操作

来源:https://www.cnblogs.com/YuanWeiBlogger/archive/2019/08/29/11432654.html
-Advertisement-
Play Games

Scala的集合體繫結構 // Scala中的集合體系主要包括:Iterable、Seq、Set、Map。其中Iterable是所有集合trait的根trai。這個結構與Java的集合體系非常相似。 // Scala中的集合是分成可變和不可變兩類集合的,其中可變集合就是說,集合的元素可以動態修改,而 ...


Scala的集合體繫結構

 

// Scala中的集合體系主要包括:IterableSeqSetMap。其中Iterable是所有集合trait的根trai。這個結構與Java的集合體系非常相似。

// Scala中的集合是分成可變和不可變兩類集合的,其中可變集合就是說,集合的元素可以動態修改,而不可變集合的元素在初始化之後,就無法修改了。分別對應scala.collection.mutablescala.collection.immutable兩個包。

// Seq下包含了RangeArrayBufferList等子trait。其中Range就代表了一個序列,通常可以使用“1 to 10”這種語法來產生一個RangeArrayBuffer就類似於Java中的ArrayList

 

 

List

// List代表一個不可變的列表

// List的創建,val list = List(1, 2, 3, 4)

// Listheadtailhead代表List的第一個元素,tail代表第一個元素之後的所有元素,list.headlist.tail

// List有特殊的::操作符,可以用於將headtail合併成一個List0 :: list

// ::這種操作符要清楚,在spark源碼中都是有體現的,一定要能夠看懂!

// 如果一個List只有一個元素,那麼它的head就是這個元素,它的tailNil

 

// 案例:用遞歸函數來給List中每個元素都加上指定首碼,並列印加上首碼的元素

def decorator(l: List[Int], prefix: String) {

  if (l != Nil) {

    println(prefix + l.head)

    decorator(l.tail, prefix)

  }

}

 

 

 

 

 

 

 

 

LinkedList

 

// LinkedList代表一個可變的列表,使用elem可以引用其頭部,使用next可以引用其尾部

// val l = scala.collection.mutable.LinkedList(1, 2, 3, 4, 5); l.elem; l.next

 

// 案例:使用while迴圈將LinkedList中的每個元素都乘以2

val list = scala.collection.mutable.LinkedList(1, 2, 3, 4, 5)

var currentList = list

while (currentList != Nil) {

  currentList.elem = currentList.elem * 2

  currentList = currentList.next

}

 

 

 

 

// 案例:使用while迴圈將LinkedList中,從第一個元素開始,每隔一個元素,乘以2

val list = scala.collection.mutable.LinkedList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

var currentList = list

var first = true

while (currentList != Nil && currentList.next != Nil) {

  if (first) { currentList.elem = currentList.elem * 2; first = false }

  currentList  = currentList.next.next

  if (currentList != Nil) currentList.elem = currentList.elem * 2

}

 

 

 

 

Set

//Set 代表一個沒有重覆元素的集合

 

 

 

 

// 將重覆元素加入Set是沒有用的,比如val s = Set(1, 2, 3); s + 1; s + 4

// 而且Set是不保證插入順序的,也就是說,Set中的元素是亂序的,val s = new scala.collection.mutable.HashSet[Int](); s += 1; s += 2; s += 5

 

// LinkedHashSet會用一個鏈表維護插入順序,val s = new scala.collection.mutable.LinkedHashSet[Int](); i += 1; s += 2; s += 5

 

// SrotedSet會自動根據key來進行排序,val s = scala.collection.mutable.SortedSet("orange", "apple", "banana")

 

 

 

 

 

集合的函數式編程

// 集合的函數式編程非常非常非常之重要!!!

// 必須完全掌握和理解Scala的高階函數是什麼意思,Scala的集合類的mapflatMapreducereduceLeftforeach等這些函數,就是高階函數,因為可以接收其他函數作為參數

// 高階函數的使用,也是ScalaJava最大的一點不同!!!因為Java裡面是沒有函數式編程的,也肯定沒有高階函數,也肯定無法直接將函數傳入一個方法,或者讓一個方法返回一個函數

// Scala高階函數的理解、掌握和使用,可以大大增強你的技術,而且也是Scala最有誘惑力、最有優勢的一個功能!!!

// 此外,在Spark源碼中,有大量的函數式編程,以及基於集合的高階函數的使用!!!所以必須掌握,才能看懂spark源碼

 

// map案例實戰:為List中每個元素都添加一個首碼

List("Leo", "Jen", "Peter", "Jack").map("name is " + _)

 

// faltMap案例實戰:將List中的多行句子拆分成單詞

List("Hello World", "You Me").flatMap(_.split(" "))

 

// foreach案例實戰:列印List中的每個單詞

List("I", "have", "a", "beautiful", "house").foreach(println(_))

 

// zip案例實戰:對學生姓名和學生成績進行關聯

List("Leo", "Jen", "Peter", "Jack").zip(List(100, 90, 75, 83))

 

 

 

 

 

 

函數式編程綜合案例:統計多個文本內的單詞總數

// 使用scalaio包將文本文件內的數據讀取出來

val lines01 = scala.io.Source.fromFile("C://Users//Administrator//Desktop//test01.txt").mkString

val lines02 = scala.io.Source.fromFile("C://Users//Administrator//Desktop//test02.txt").mkString

// 使用List的伴生對象,將多個文件內的內容創建為一個List

val lines = List(lines01, lines02)

 

// 下麵這一行才是我們的案例的核心和重點,因為有多個高階函數的鏈式調用,以及大量下劃線的使用,如果沒有透徹掌握之前的課講解的Scala函數式編程,那麼下麵這一行代碼,完全可能會看不懂!!!

// 但是下麵這行代碼其實就是Scala編程的精髓所在,就是函數式編程,也是Scala相較於Java等編程語言最大的功能優勢所在

// 而且,spark的源碼中大量使用了這種複雜的鏈式調用的函數式編程

// 而且,spark本身提供的開發人員使用的編程api的風格,完全沿用了Scala的函數式編程,比如Spark自身的api中就提供了mapflatMapreduceforeach,以及更高級的reduceByKeygroupByKey等高階函數

// 如果要使用Scala進行spark工程的開發,那麼就必須掌握這種複雜的高階函數的鏈式調用!!!

 

lines.flatMap(_.split(" ")).map((_, 1)).map(_._2).reduceLeft(_ + _)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • python判斷字元串中是否包含子字元串 s = '1234問沃爾沃434' if s.find('沃爾沃') != -1: print('存在') else: print('不存在') ...
  • 一. 什麼是IoC 當在A類中要使用B類的時候,我們一般都是採用new的方式來實例化B類,這樣一來這兩個類就有很強的依賴關係,不符合低耦合的設計思想。這時候我們可以通過一個中間容器來實例化對象,需要的時候就可以通過容器獲取一個B類的對象。這種思想就是IoC(控制反轉),其實我覺得叫控制轉移更為合適, ...
  • python提供了一個跨平臺的多進程支持——multiprocessing模塊,其包含Process類來代表一個進程對象 1、Process語法結構:(註: 傳參的時候一定使用關鍵字傳參) 2、自定義進程類:需要繼承Process類 自定義類的時候必須註意的事項: 第一,必須繼承Process類的構 ...
  • 原文:阿裡 RocketMQ 安裝與簡介 一、簡介 官方簡介: l RocketMQ是一款分散式、隊列模型的消息中間件,具有以下特點: l 能夠保證嚴格的消息順序 l 提供豐富的消息拉取模式 l 高效的訂閱者水平擴展能力 l 實時的消息訂閱機制 l 億級消息堆積能力 二、網路架構 三、特性 1. n ...
  • 原文:https://blog.csdn.net/lyly4413/article/details/80838716 1.消息中間件的發展: 第一代以ActiveMQ為代表,遵循JMS(java消息服務)規範 第二代以RabbitMQ為代表是一個有Erlang語言開發的AMQP(高級消息隊列協議)的 ...
  • 今天開始學習設計模式,藉此機會學習並整理學習筆記。 設計模式是一門不區分語言的課程,什麼樣的編程語言都可以用到設計模式。如果說java語法規則比作武功招式的話,那麼設計模式就是心法。 設計模式共有23種,常見的19種,最常用的9-10種。 設計模式分三種類型:創建型、結構型、行為型; 其中創建型包含 ...
  • Django之靜態文件,中間件,admin後臺管理;其中,靜態文件 包括靜態文件的使用,動態生成靜態文件的路徑;中間件包括 使用中間件,使用中間件防爬蟲ip案例;admin後臺管理 包括 admin的使用,列表頁選項,編輯頁選項等。 ...
  • 方法1. 函數:fill 舉例說明:應力分佈雲圖 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...