JAVA8給我帶了什麼——流的概念和收集器

来源:https://www.cnblogs.com/hayasi/archive/2019/03/30/10628575.html
-Advertisement-
Play Games

到現在為止,筆者不敢給流下定義,從概念來講他應該也是一種數據元素才是。可是在我們前面的代碼例子中我們可以看到他更多的好像在表示他是一組處理數據的行為組合。這讓筆者很難去理解他的定義。所以筆者不表態。各位同志自行理解吧。在沒有流以前,處理集合裡面的數據一般都會用到顯示的迭代器。用一下前面學生的例子吧。 ...


到現在為止,筆者不敢給流下定義,從概念來講他應該也是一種數據元素才是。可是在我們前面的代碼例子中我們可以看到他更多的好像在表示他是一組處理數據的行為組合。這讓筆者很難去理解他的定義。所以筆者不表態。各位同志自行理解吧。
在沒有流以前,處理集合裡面的數據一般都會用到顯示的迭代器。用一下前面學生的例子吧。目標是獲得學分大於5的前倆位同學。

 1 package com.aomi;
 2 
 3 import java.util.ArrayList;
 4 import java.util.Iterator;
 5 import java.util.List;
 6 import static java.util.stream.Collectors.toList;
 7 
 8 public class Main {
 9 
10     public static void main(String[] args) {
11         // TODO Auto-generated method stub
12 
13         List<Student> stus = getSources();
14 
15         Iterator<Student> ite = stus.iterator();
16 
17         List<String> names = new ArrayList<>();
18         int limit = 2;
19         while (ite.hasNext() && limit > 0) {
20 
21             Student stu = ite.next();
22 
23             if (stu.getScore() > 5) {
24 
25                 names.add(stu.getName());
26                 limit--;
27             }
28         }
29 
30         for (String name : names) {
31             System.out.println(name);
32         }
33 
34     }
35 
36     public static List<Student> getSources() {
37         List<Student> students = new ArrayList<>();
38 
39         Student stu1 = new Student();
40 
41         stu1.setName("lucy");
42         stu1.setSex(0);
43         stu1.setPhone("13700227892");
44         stu1.setScore(9);
45 
46         Student stu2 = new Student();
47         stu2.setName("lin");
48         stu2.setSex(1);
49         stu2.setPhone("15700227122");
50         stu2.setScore(9);
51 
52         Student stu3 = new Student();
53         stu3.setName("lili");
54         stu3.setSex(0);
55         stu3.setPhone("18500227892");
56         stu3.setScore(8);
57 
58         Student stu4 = new Student();
59 
60         stu4.setName("dark");
61         stu4.setSex(1);
62         stu4.setPhone("16700555892");
63         stu4.setScore(6);
64 
65         students.add(stu1);
66         students.add(stu2);
67         students.add(stu3);
68         students.add(stu4);
69 
70         return students;
71     }
72 
73 }

如果用流的話是這樣子的。

public static void main(String[] args) {
        // TODO Auto-generated method stub

        List<Student> stus = getSources();

        List<String> names = stus.stream()
                .filter(st -> st.getScore() > 5)
                .limit(2)
                .map(st -> st.getName())
                .collect(toList());
        for (String name : names) {
            System.out.println(name);
        }

    }

 把這倆段代碼相比較主要是為了說明一個概念:以前做法都是在外部迭代,最為體現就是筆者在外面定義了一個集合names 。而流卻什麼也沒有,現在我們應該能清楚感受到流是在內部迭代。也就是說流已經幫你做好了迭代。我們只要傳入相關的函數就可以得到想要的結果。至於內部迭代的好處,筆者沒有辦法親身的感受,唯一的感覺就是代碼變的簡單明瞭了。但是官方說Stream庫為了我們在內部迭代裡面做了很多優化和充公利用性能的操作。比如並行操作。所以筆者就聽官方了。

事實上,在用流的過程中,我們用到很多方法函數。比如上面的limit方法,filter方法等。這個定義為流操作。但是不管是什麼操作,你必須要有一個數據源吧。總結如下:

  • 數據源:用於生成流的數據,比如集合。
  • 流操作:類似於limit方法,filter方法。

流還有一種特點——部分流操作是沒有執行的。一般都是在collect函數執行的時候,才開始執行個個函數。所以我們可以細分一下流操作:

  • 數據源:用於生成流的數據,比如集合。
  • 中間操作:類似於limit方法,filter方法。這些操作做變了一個操作鏈,有一點流水線的概念。
  • 終端操作:執行上面的操作鏈。比如collect函數。

從上面的講解我們就可以感覺流好像是先收集相關的目標操作,什麼意思呢?就是先把要做的事情計劃一下,最後一聲令下執行。而下這個命令是collect函數。這一點跟.NET的Linq是很像的。同時記得他只能執行一次。也就是說這個流執行一次之後,就不可能在用了。
筆者列一下以前的用到的函數

forEach:終端
collect:終端
count:終端
limit:中間
filter:中間
map:中間
sorted:中間

到目前為止我們用到的流都是通過集合來建一個流。筆者對此從來沒有講過。現在筆者來講些構建流的方式。
在stream庫裡面為我們提供了這樣子一個方法——Stream.of

package com.aomi;

import java.util.Optional;
import java.util.stream.Stream;

public class Main {

	public static void main(String[] args) {
		// TODO Auto-generated method stub

		Stream stream = Stream.of("I", "am", "aomi");

		Optional<String> firstWord = stream.findFirst();
		
		if(firstWord.isPresent())
		{
			System.out.println("第一個字:"+firstWord.get());
		}
	}

}

運行結果:

去看一下of方法的代碼。如下

public static<T> Stream<T> of(T... values) {
        return Arrays.stream(values);
    }

說明我們可能指定一個類型來建一個流。上面可以修改為

Stream<String> stream = Stream.of("I", "am", "aomi");

findFirst函數用於表示返回第一個值。那就是可能數據源是一個空呢?所以他有可以會返回null。所以就是用一個叫Optional類的表示可以為空。這樣子我們就可以用Optional類的方法進一步做安全性的操作。比如判斷有沒有值(isPresent())
筆者想要建一個int類型的數組流玩玩。為了方便筆者便試給一下上面的代碼。卻發現報錯了。

如果我把int改為Integer呢?沒有問題了。所以註意要用引用類型的。int類型對應為Integer類型。

 1 package com.aomi;
 2 
 3 import java.util.Optional;
 4 import java.util.stream.Stream;
 5 
 6 public class Main {
 7 
 8     public static void main(String[] args) {
 9         // TODO Auto-generated method stub
10 
11         Stream<Integer> stream = Stream.of(1, 2, 9);
12 
13         Optional<Integer> firstWord = stream.findFirst();
14         
15         if(firstWord.isPresent())
16         {
17             System.out.println("第一個字:"+firstWord.get());
18         }
19     
20     }
21 
22 }

運行結果:

那想要用int類型呢?什麼辦呢?改改

 1 package com.aomi;
 2 
 3 import java.util.OptionalInt;
 4 import java.util.stream.IntStream;
 5 
 6 public class Main {
 7 
 8     public static void main(String[] args) {
 9         // TODO Auto-generated method stub
10 
11         IntStream stream = IntStream.of(1, 2, 9);
12 
13         OptionalInt firstWord = stream.findFirst();
14         
15         if(firstWord.isPresent())
16         {
17             System.out.println("第一個字:"+firstWord.getAsInt());
18         }
19     
20     }
21 
22 }

運行結果:

我們以上面的例子來一個猜測:是不是Double類型,只要修改為DoubleStream就行呢?試試。

 1 package com.aomi;
 2 
 3 import java.util.OptionalDouble;
 4 import java.util.stream.DoubleStream;
 5 
 6 public class Main {
 7 
 8     public static void main(String[] args) {
 9         // TODO Auto-generated method stub
10 
11         DoubleStream stream = DoubleStream.of(1.3, 2.3, 9.5);
12 
13         OptionalDouble firstWord = stream.findFirst();
14         
15         if(firstWord.isPresent())
16         {
17             System.out.println("第一個字:"+firstWord.getAsDouble());
18         }
19     
20     }
21 
22 }

運行結果:

結果很明顯,我們的猜測是對的。所以見意如果你操作的流是一個int或是double的話,請進可能的用XxxStream 來建流。這樣子在流的過程中不用進行拆裝和封裝了。必竟這是要性能的。在看一下如果數據源是一個數組的情況我們如何生成流呢?

1  public static Collector<CharSequence, ?, String> joining(CharSequence delimiter,
2                                                              CharSequence prefix,
3                                                              CharSequence suffix) {
4         return new CollectorImpl<>(
5                 () -> new StringJoiner(delimiter, prefix, suffix),
6                 StringJoiner::add, StringJoiner::merge,
7                 StringJoiner::toString, CH_NOID);
8     }

在看一個叫toList函數的代碼。

1 public static <T>
2     Collector<T, ?, List<T>> toList() {
3         return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,
4                                    (left, right) -> { left.addAll(right); return left; },
5                                    CH_ID);
6     }

我們發現他會共同的返回一個Collector類型。從上面我們就可以知道他的任務就是用去處理最後數據。我們把他定為收集器。讓我們看一下收集器的介面代碼吧;

 1 public interface Collector<T, A, R> {
 2 
 3     Supplier<A> supplier();
 4 
 5     BiConsumer<A, T> accumulator();
 6 
 7     BinaryOperator<A> combiner();
 8 
 9     Function<A, R> finisher();
10 
11     Set<Characteristics> characteristics();
12 }

光看前面四個方法是不是有一點熟悉的感覺。想要說明這個五個方法的作用。就必須明白一個概念——並行歸約。前面筆者講過流是一個內部迭代,也說Stream庫為我們做一個很多優化的事情。其中一個就是並行。他用到了JAVA 7引入的功能——分支/合併框架。也就是說流會以遞歸的方式拆分成很多子流,然後子流可以並行執行。最後在倆倆的子流的結果合併成一個最終結果。而這倆倆合併的行為就叫歸約 。如圖下。引用於《JAVA8實戰》

 

 

我們必鬚根據圖上的意思來走。子流的圖裡面會調用到Collector類的三個方法。

  • supplier方法:用創建數據存儲的地方。
  • accumulator方法:用於子流執行過程的迭代工作。即是遍歷每一項都會執行。所以可以這裡做一些工作。
  • finisher方法:返回最後的結果,你可以在這裡進一步處理結果。

每一個子流結束這之後,就是倆倆合併。這個時候就要看流的機製圖了。

  • combiner方法:會傳入每一個子流的結果過來,我們就可以在這裡在做一些工作。
  • finisher方法:返回最後的結果。同上面子流的一樣子。

好像沒有characteristics什麼事情。不是這樣子的。這個方法是用來說明當前這個流具備哪些優化。這樣子執行流的時候,就可以很清楚的知道要以什麼樣子的方式執行了。比如並行。
他是一個enum類。值如下

  • UNORDERED:這個表示執行過程中結果不受歸約和遍歷的影響
  • CONCURRENT:表示可以多個線和調用accumulator方法。並且可以執行並行。當然前無序數據的才並行。除非收集器標了UNORDERED。
  • IDENTITY_FINISH:表示這是一個恆等函數,就是做了結果也一樣子。不用做了可以跳過了。

由了上面的講說明,我們在來寫一個自己的收集器吧——去除相同的單詞
DistinctWordCollector類:

 1 package com.aomi;
 2 
 3 import java.util.ArrayList;
 4 import java.util.Collections;
 5 import java.util.EnumSet;
 6 import java.util.List;
 7 import java.util.Set;
 8 import java.util.function.BiConsumer;
 9 import java.util.function.BinaryOperator;
10 import java.util.function.Function;
11 import java.util.function.Supplier;
12 import java.util.stream.Collector;
13 
14 public class DistinctWordCollector implements Collector<String, List<String>, List<String>> {
15 
16     @Override
17     public Supplier<List<String>> supplier() {
18         // TODO Auto-generated method stub
19         return () -> new ArrayList<String>();
20     }
21 
22     /**
23      * 子流的處理項的過程
24      */
25     @Override
26     public BiConsumer<List<String>, String> accumulator() {
27         // TODO Auto-generated method stub
28         return (List<String> src, String val) -> {
29 
30             if (!src.contains(val)) {
31                 src.add(val);
32             }
33         };
34     }
35 
36     /**
37      * 倆倆併合的執行函數
38      */
39     @Override
40     public BinaryOperator<List<String>> combiner() {
41         // TODO Auto-generated method stub
42         return (List<String> src1, List<String> src2) -> {
43             for (String val : src2) {
44                 if (!src1.contains(val)) {
45                     src1.add(val);
46                 }
47             }
48             return src1;
49         };
50     }
51 
52     @Override
53     public Function<List<String>, List<String>> finisher() {
54         // TODO Auto-generated method stub
55         return Function.identity();
56     }
57 
58     @Override
59     public Set<Characteristics> characteristics() {
60         // TODO Auto-generated method stub
61         return Collections.unmodifiableSet(EnumSet.of(Characteristics.IDENTITY_FINISH, Characteristics.CONCURRENT));
62     }
63 
64 }

Main:

 1 public static void main(String[] args) {
 2         // TODO Auto-generated method stub
 3 
 4         List<String> words = Arrays.asList("aomi","lili","lucy","aomi","Nono");
 5 
 6         List<String> vals = words.stream().collect(new DistinctWordCollector());
 7         
 8         for (String val : vals) {
 9             System.out.println(val);
10         }
11     }
12

運行結果

結果確定就是我們想要的——去掉了重覆的aomi


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 方法memory_get_usage 是指當前腳本正在使用的記憶體 unset只是把記憶體標記為空閑但並沒有釋放,要GC程式結束後才會釋放 $bytes = memory_get_peak_usage(); function formatBytes($bytes, $precision = 2) { $ ...
  • 1. zuul網關入門(一、網關具有的功能) 1.1. 基本場景 1.1.1. API網關的由來 1.1.2. API網關基本功能 1.2. 高級應用 1.2.1. 亮點 1. 可動態發佈的過濾器機制 1.2.2. 紅綠部署 1.2.3. 開發者測試分支 1.2.4. 埋點測試 1.2.5. 壓力測 ...
  • 1.構造函數不能為虛函數 當我們將構造函數定義為虛函數時,會直接報錯: 首先回憶下以前學的virtual虛函數概念: 如果類定義了虛函數,創建對象時,則會分配記憶體空間,並且為該父類以及其所有子類的記憶體空間上額外分配一個虛函數表. 虛函數表的作用在於,存儲每個類的相同的虛函數名,然後每一次虛函數調用, ...
  • 1 資料庫分類 MySQL Oracle redis 2 MySQL 存儲引擎有哪些 ENGINE=InnoDB 提供事務安全表,支持外鍵。 MyISAM Memory數據存入記憶體中,如果記憶體出現異常或事重啟關機,所有數據都會消失 3 事務 概念:邏輯上的一組sql語句,組成這組操作的sql語句,要 ...
  • 數字 1、數字類型 python支持多種數字類型:整型、長整型、布爾型、雙精度浮點型、十進位浮點型和複數 。 創建數值對象並賦值 aint=1 along=-999999999999999L afloat=3.1415973434325 acomplex=1.34+3.45J 2、整型 布爾類型:T ...
  • 1: type() 我們知道動態語言和靜態語言最大的不同,就是函數和類的定義,不是編譯時定義的,而是運行時動態創建的。 比方說我們要定義一個Person的class: 輸出: 我們說class的定義是運行時動態創建的,而創建class的方法就是使用type()函數。 type()函數既可以返回一個對 ...
  • turtle庫常用函數 引入turtle模塊 turtle的繪圖窗體 turtle的RGB色彩模式 畫筆控制函數 運動控制函數 方向控制函數 實例 ...
  • 最近在讀order of evaluation violations,其中的一個例子使我很困惑。 1)如果對一個標量對象的副作用相對於對這個標量對象的另一個副作用是無序的,那麼這是未定義行為。 在這段代碼中,很明顯 i 是一個標量對象。 算術類型(3.9.1),枚舉類型,指針類型,指針成員類型(3. ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...