Java 8 Stream 的終極技巧——Collectors 操作

来源:https://www.cnblogs.com/felordcn/archive/2020/01/02/collectors.html
-Advertisement-
Play Games

昨天在 Collection移除元素操作 相關的文章中提到了 Collectors 。相信很多同學對這個比較感興趣,那我們今天就來研究一下 Collectors ...


1. 前言

昨天在 Collection移除元素操作 相關的文章中提到了 Collectors 。相信很多同學對這個比較感興趣,那我們今天就來研究一下 Collectors

2. Collectors 的作用

CollectorsJava 8 加入的操作類,位於 java.util.stream 包下。它會根據不同的策略將元素收集歸納起來,比如最簡單常用的是將元素裝入MapSetList 等可變容器中。特別對於 Java 8 Stream Api 來說非常有用。它提供了collect() 方法來對 Stream 流進行終結操作派生出基於各種策略的結果集。我們就藉助於 Stream 來熟悉一下 Collectors 吧。我們依然用昨天的例子:

    List<String> servers = new ArrayList<>();
        servers.add("Felordcn");
        servers.add("Tomcat");
        servers.add("Jetty");
        servers.add("Undertow");
        servers.add("Resin");

3. Java 8 中 Collectors 的方法

Collectors 提供了一系列的靜態方法供我們使用,通常情況我們靜態導入即可使用。接下來我們來看看都提供了哪些方法吧。

3.1 類型歸納

這是一個系列,作用是將元素分別歸納進可變容器 ListMapSetCollection 或者ConcurrentMap

    Collectors.toList();
    Collectors.toMap();
    Collectors.toSet();
    Collectors.toCollection();
    Collectors.toConcurrentMap();

我們可以根據以上提供的 API 使用 Streamcollect 方法中的轉換為熟悉的集合容器。非常簡單這裡不再演示。

3.2 joining

將元素以某種規則連接起來。該方法有三種重載 joining(CharSequence delimiter)joining(CharSequence delimiter,CharSequence prefix,CharSequence suffix)

 //   輸出 FelordcnTomcatJettyUndertowResin
 servers.stream().collect(Collectors.joining());

 //   輸出 Felordcn,Tomcat,Jetty,Undertow,Resin
 servers.stream().collect(Collectors.joining("," ));

 //   輸出 [Felordcn,Tomcat,Jetty,Undertow,Resin]
 servers.stream().collect(Collectors.joining(",", "[", "]")); 

用的比較多的是讀取 HttpServletRequest 中的 body

  HttpServletRequest.getReader().lines().collect(Collectors.joining());

3.3 collectingAndThen

該方法先執行了一個歸納操作,然後再對歸納的結果進行 Function 函數處理輸出一個新的結果。

 // 比如我們將servers joining 然後轉成大寫,結果為: FELORDCN,TOMCAT,JETTY,UNDERTOW,RESIN   
 servers.stream.collect(Collectors.collectingAndThen(Collectors.joining(","), String::toUpperCase));

3.4 groupingBy

按照條件對元素進行分組,和 SQL 中的 group by 用法有異曲同工之妙,通常也建議使用 Java 進行分組處理以減輕資料庫壓力。groupingBy 也有三個重載方法
我們將 servers 按照長度進行分組:

// 按照字元串長度進行分組    符合條件的元素將組成一個 List 映射到以條件長度為key 的 Map<Integer, List<String>> 中
servers.stream.collect(Collectors.groupingBy(String::length))

如果我不想 MapvalueList 怎麼辦? 上面的實現實際上調用了下麵的方式:

 //Map<Integer, Set<String>>
 servers.stream.collect(Collectors.groupingBy(String::length, Collectors.toSet()))

我要考慮同步安全問題怎麼辦? 當然使用線程安全的同步容器啊,那前兩種都用不成了吧! 別急! 我們來推斷一下,其實第二種等同於下麵的寫法:

 Supplier<Map<Integer,Set<String>>> mapSupplier = HashMap::new;
 Map<Integer,Set<String>> collect = servers.stream.collect(Collectors.groupingBy(String::length, mapSupplier, Collectors.toSet()));

這就非常好辦了,我們提供一個同步 Map 不就行了,於是問題解決了:

 Supplier<Map<Integer, Set<String>>> mapSupplier = () -> Collections.synchronizedMap(new HashMap<>());
 Map<Integer, Set<String>> collect = servers.stream.collect(Collectors.groupingBy(String::length, mapSupplier, Collectors.toSet()));

其實同步安全問題 Collectors 的另一個方法 groupingByConcurrent 給我們提供瞭解決方案。用法和 groupingBy 差不多。

3.5 partitioningBy

partitioningBy 我們在本文開頭的提到的文章中已經見識過了,可以看作 groupingBy 的一個特例,基於斷言(Predicate)策略分組。這裡不再舉例說明。

3.6 counting

該方法歸納元素的的數量,非常簡單,不再舉例說明。

3.7 maxBy/minBy

這兩個方法分別提供了查找大小元素的操作,它們基於比較器介面 Comparator 來比較 ,返回的是一個 Optional 對象。 我們來獲取 servers 中最小長度的元素:

 // Jetty  
Optional<String> min = servers.stream.collect(Collectors.minBy(Comparator.comparingInt(String::length)));

這裡其實 Resin 長度也是最小,這裡遵循了 "先入為主" 的原則 。當然 Stream.min() 可以很方便的獲取最小長度的元素。maxBy 同樣的道理。

3.8 summingInt/Double/Long

用來做累加計算。計算元素某個屬性的總和,類似 Mysqlsum 函數,比如計算各個項目的盈利總和、計算本月的全部工資總和等等。我們這裡就計算一下 servers 中字元串的長度之和 (為了舉例不考慮其它寫法)。

 // 總長度 32 
 servers.stream.collect(Collectors.summingInt(s -> s.length()));

3.9 summarizingInt/Double/Long

如果我們對 3.6章節-3.8章節 的操作結果都要怎麼辦?難不成我們搞5個 Stream 流嗎? 所以就有了 summarizingIntsummarizingDoublesummarizingLong 三個方法。
這三個方法通過對元素某個屬性的提取,會返回對元素該屬性的統計數據對象,分別對應 IntSummaryStatisticsDoubleSummaryStatisticsLongSummaryStatistics。我們對 servers 中元素的長度進行統計:

 DoubleSummaryStatistics doubleSummaryStatistics = servers.stream.collect(Collectors.summarizingDouble(String::length));
  // {count=5, sum=32.000000, min=5.000000, average=6.400000, max=8.000000}
  System.out.println("doubleSummaryStatistics.toString() = " + doubleSummaryStatistics.toString());

結果 DoubleSummaryStatistics 中包含了 總數,總和,最小值,最大值,平均值 五個指標。

3.10 mapping

該方法是先對元素使用 Function 進行再加工操作,然後用另一個Collector 歸納。比如我們先去掉 servers 中元素的首字母,然後將它們裝入 List

 // [elordcn, omcat, etty, ndertow, esin]
 servers.stream.collect(Collectors.mapping(s -> s.substring(1), Collectors.toList()));

有點類似 Stream 先進行了 map 操作再進行 collect

 servers.stream.map(s -> s.substring(1)).collect(Collectors.toList());

3.11 reducing

這個方法非常有用!但是如果要瞭解這個就必須瞭解其參數 BinaryOperator<T> 。 這是一個函數式介面,是給兩個相同類型的量,返回一個跟這兩個量相同類型的一個結果,偽表達式為 (T,T) -> T。預設給了兩個實現 maxByminBy ,根據比較器來比較大小並分別返回最大值或者最小值。當然你可以靈活定製。然後 reducing 就很好理解了,元素兩兩之間進行比較根據策略淘汰一個,隨著輪次的進行元素個數就是 reduce 的。那這個有什麼用處呢? Java 官方給了一個例子:統計每個城市個子最高的人。

  Comparator<Person> byHeight = Comparator.comparing(Person::getHeight);
     Map<String, Optional<Person>> tallestByCity = people.stream()
                          .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(BinaryOperator.maxBy(byHeight))));

結合最開始給的例子你可以使用 reducing 找出最長的字元串試試。

上面這一層是根據 Height 屬性找最高的 Person ,而且如果這個屬性沒有初始化值或者沒有數據,很有可能拿不到結果所以給出的是 Optional<Person>。 如果我們給出了 identity 作一個基準值,那麼我們首先會跟這個基準值進行 BinaryOperator 操作。
比如我們給出高於 2 米 的人作為 identity。 我們就可以統計每個城市不低於 2 米 而且最高的那個人,當然如果該城市沒有人高於 2 米則返回基準值identity

 Comparator<Person> byHeight = Comparator.comparing(Person::getHeight);
 Person identity= new Person();
           identity.setHeight(2.);
           identity.setName("identity");
     Map<String, Person> collect = persons.stream()
                        .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(identity, BinaryOperator.maxBy(byHeight))));

這時候就確定一定會返回一個 Person 了,最起碼會是基準值identity 不再是 Optional

還有些情況,我們想在 reducing 的時候把 Person 的身高先四捨五入一下。這就需要我們做一個映射處理。定義一個 Function<? super T, ? extends U> mapper 來乾這個活。那麼上面的邏輯就可以變更為:

   Comparator<Person> byHeight = Comparator.comparing(Person::getHeight);
        Person identity = new Person();
        identity.setHeight(2.);
        identity.setName("identity");
        // 定義映射 處理 四捨五入
        Function<Person, Person> mapper = ps -> {
            Double height = ps.getHeight();

            BigDecimal decimal = new BigDecimal(height);
            Double d = decimal.setScale(1, BigDecimal.ROUND_HALF_UP).doubleValue();
            ps.setHeight(d);
            return ps;
        };
        Map<String, Person> collect = persons.stream()
                .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(identity, mapper, BinaryOperator.maxBy(byHeight))));

4. 總結

今天我們對 Java 8 中的 Collectors 進行了詳細的講解。如果你熟悉了 Collectors 操作 Stream 會更加得心應手。當然在 Java 8 之後的 Java 9Java 12Collectors 都有新增的功能, 後面有時間我們會繼續進行講解。敬請關註!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、複習了一維數組,還複習了強制類型轉換的註意點。 package com.bjpowernode.java_learning; public class D67_1_GoDeepIntoArrays { public static void main(String[] args) { //創建一個 ...
  • 任何一種程式設計語言設計的程式在運行時都有可能出現錯誤。 捕獲錯誤最理想的是在編譯期間,但有的錯誤只有在運行時才會發生。 對於這些錯誤,一般有兩種解決方法: 遇到錯誤就終止程式的運行。 由程式員在編寫程式時,就考慮到錯誤的檢測、錯誤消息的提示,以及錯誤的處理。 java異常 在java語言中,將程式 ...
  • 職工管理管理系統 課程設計 本次課程設計,我還挺幸運的,抽到一道這麼簡單的題,思路很簡單,但拓展很強,相比其他同學的,我這個簡直是。。。,真是運氣太好了, 代碼寫了1500多行吧,做課程設計中,我也學到了很多東西,代碼太多,就放到了 "github" 上了 下麵是一個總體概述,和一個README.m ...
  • 要註意 WSGI / uwsgi / uWSGI 這三個概念的區分。 WSGI是一種通信協議。 uwsgi是一種線路協議而不是通信協議,在此常用於在uWSGI伺服器與其他網路伺服器的數據通信。 uWSGI是實現了uwsgi和WSGI兩種協議的Web伺服器。 nginx是一個開源的高性能的HTTP服務 ...
  • 學習SpringBoot配置應用名稱,結果發現坑 到網上找 到 https://blog.csdn.net/qq_40087415/article/details/82497668 server: port:8088 context-path:/springboot-demo 實際,在我的Sprin ...
  • Git是什麼? Git 是一個開源的分散式版本控制系統,用於敏捷高效地處理任何或小或大的項目。 Git 是 Linus Torvalds 為了幫助管理 Linux 內核開發而開發的一個開放源碼的版本控制軟體。 Git 與常用的版本控制工具 CVS, Subversion 等不同,它採用了分散式版本庫 ...
  • 最近比較閑,寫了個遞歸調用獲取最大公約數,剛開始寫錯了,但一直不明白錯在哪,錯誤代碼如下: public class Demo { public static void main(String[] args) { int gcd = gcd(5, 15); System.out.println(gc ...
  • 自增、自減操作符 自增自減操作符是可以直接改變變數值的操作符 前加加、前減減(先賦值後使用) 後加加、後加加(先使用後賦值) 實際上是一個+1操作和一個賦值操作的縮寫形式(a++; a=a+1; a+=1;) public class IncreaseDecrease { public static ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...