禁止轉載 重寫了之前博客寫的泛型相關內容,全部整合到這一篇文章里了,把坑都填了,後續不再糾結這些問題了。本文深度總結了函數式思想、泛型對在Java中的應用,解答了許多比較難的問題。 純函數 協變 逆變 泛型通配符 PECS法則 自限定 Part 1: 協變與逆變 Java8 引入了函數式介面,從此方 ...
禁止轉載
重寫了之前博客寫的泛型相關內容,全部整合到這一篇文章里了,把坑都填了,後續不再糾結這些問題了。本文深度總結了函數式思想、泛型對在Java中的應用,解答了許多比較難的問題。
- 純函數
- 協變
- 逆變
- 泛型通配符
- PECS法則
- 自限定
Part 1: 協變與逆變
Java8 引入了函數式介面,從此方法傳參可以傳遞函數了,有人說這是語法糖。
實際上,這是編程範式的轉換,思想體系的變化。
一、純函數—沒有副作用
純函數的執行不會帶來對象內部參數、方法參數、資料庫等的改變,這些改變都是副作用。比如Integer::sum是一個純函數,輸入為兩個int,輸出為兩數之和,兩個輸入量不會改變,在Java 中可以申明為final int類型。
副作用的執行
Java對於不變類的約束明顯不足,比如final array只能保證引用的指向不變,array內部的值還是可以改變的,如果存在第二個引用指向相同的array,那麼將無法保證array不可變;標準庫中的collection常用的還是屬於可變mutable類型,可變類型在使用時很便利。
在函數式思想下,函數是一等公民,函數是有值的,比如Integer::sum就是函數類型BiFunction<Integer, Integer, Integer>的一個值,沒有副作用的函數保證了函數可以看做一個黑盒,一個固定的輸入便有固定的輸出。
那麼Java中對象的方法是純函數嗎?
大多數時候不是。對象的方法受到對象的狀態影響,如果對象的狀態不發生改變,同時不對外部產生影響(比如列印字元串),可以看做純函數。
本文之後討論的函數都預設為純函數。
二、協變—更抽象的繼承關係
協變和逆變描述了繼承關係的傳遞特性,協變比逆變更好理解。
協變的簡單定義:如果A是B的子類,那麼F(A)是F(B) 的子類。F表示的是一種類型變換。
比如:貓是動物,表示為Cat < Animal,那麼一群貓是一群動物,表示為List[Cat] < List[Aniaml]。
上面的關係很好理解,在面向對象語言中,is-a表示為繼承關係,即貓是動物的子類(subtype)。
所以,協變可以這樣表示:
A < B ⇒ F(A) < F(B)
在貓的例子中,F表示集合。
那麼如果F是函數呢?
我們定義函數F=Provider,函數的類型定義包括入參和出參,簡單地考慮入參為空,出參為Animal和Cat的情況。簡單理解為方法F定義為獲取貓或動物。
那麼Supplier作用Cat和Animal上,原來的類型關係保持嗎?
答案是保持,Supplier[Cat] < Supplier[Animal]。也就是說獲取一隻貓就是獲取一隻動物。轉換成面向對象的語言,Supplier[Cat]是Supplier[Animal]的子類。
在面向對象語言中,子類關係常常表現為不同類型之間的相容。也就是說傳值的類型必須為聲明的類型的子類。如下麵的代碼是好的
List[User] users = List(user1, user2)
List[Animal] animals = cats
Supplier[Animal] supplierWithAnimal = supplierWithCat
// 使用Supplier[Animal],實際上得到的是Cat
Animal animal = supplierWithAnimal.get()
我們來看下某百科對於里氏替換原則(LSP)的定義:
里氏代換原則(Liskov Substitution Principle LSP)面向對象設計的基本原則之一。 里氏代換原則中說,任何父類可以出現的地方,子類一定可以出現。 LSP是繼承復用的基石,只有當子類可以替換掉父類,軟體單位的功能不受到影響時,父類才能真正被覆用,而子類也能夠在父類的基礎上增加新的行為。里氏代換原則是對“開-閉”原則的補充。實現“開-閉”原則的關鍵步驟就是抽象化。而子類與父類的繼承關係就是抽象化的具體實現,所以里氏代換原則是對實現抽象化的具體步驟的規範。
Animal animal = new Cat(”kitty”);
在UML圖中,一般父類在上,子類在下。因此,子類賦值到父類聲明的過程可以形象地稱為向上轉型。
總結一下:協變是LSP的體現,形象的理解為向上轉型。
三、逆變—難以理解的概念
與協變的定義相反,逆變可以這樣表示:
A < B ⇒ F(B) < F(A)
最簡單的逆變類是Consumer[T],考慮Consumer[Fruit] 和 Consumer[Apple]。榨汁機就是一類Consumer,接受的是水果,輸出的是果汁。我定義的函數accpt為了避免副作用,返回字元串,然後再列印。
下麵我用scala寫的示例,其比Java簡潔一些,也是靜態強類型語言。你可以使用網路上的 playground 運行(eg: scastie.scala-lang.org)。
// scala 變數名在前,類型在後,函數返回類型在括弧後,可以省略
class Fruit(val name: String) {}
class Apple extends Fruit("蘋果") {}
class Orange extends Fruit("橙子") {}
// 榨汁機,T表示泛型,<:表示匹配上界(榨汁機只能榨果汁),-T 表示T支持逆變
class Juicer[-T <: Fruit] {
def accept(fruit: T) = s"${fruit.name}汁"
}
val appleJuicer: Juicer[Apple] = Juicer[Fruit]()
println(appleJuicer.accept(Apple()))
// 編譯不通過,因為appleJuicer的類型是Juicer[Apple]
// 雖然聲明appleJuicer時傳遞的值是水果榨汁機,但是編譯器只做類型檢查,Juicer[Apple]類型不能接受其他水果
println(appleJuicer.accept(Orange()))
榨汁機 is-a 榨蘋果汁機,因為榨汁機可以榨蘋果。
逆變難以理解的點就在於逆變考慮的是函數的功能,而不是函數具體的參數。
參數傳參原則上都可以支持逆變,因為對於純函數而言,參數值並不可變。
再舉一個例子,Java8 中stream的map方法需要的參數就是一個函數:
// map方法聲明
<R> Stream<R> map(Function<? super T, ? extends R> mapper);
// 此時方法的參數就是T,我們傳遞的mapper的入參可以為T的父類, 因為mapper支持參數逆變
// 如下程式可以運行
// 你可以對任意一個Stream<T>流使用map(Object::toString),因為在Java中所有類都繼承自Object。
Stream.of(1, 2, 3).map(Object::toString).forEach(System.out::println);
問題可以再複雜一點,如果函數的參數為集合類型,還可以支持逆變嗎?
當然可以,如前所述,逆變考慮的是函數的功能,傳入一個更為一般的函數也可以處理具體的問題。
// Scala中可以使用 ::: 運算符合併兩個List, 下一行是List中對方法:::的聲明
// def ::: [B >: A](prefix: List[B]): List[B]
// 這個方法在Java很難實現,你可以看看ArrayList::addAll的參數, 然後想想曲線救國的方案,下一篇文章我會詳細討論
// usage
val list: List[Fruit] = List(Apple()) ::: (List(Fruit("水果")))
println(list)
// output: List(Playground$Apple@74046e99, Playground$Fruit@8f0fecd)
總結一下:函數的入參可以支持逆變,即參數的繼承關係和函數的繼承關係相反,逆變的函數更通用。
Part 2: 深入理解泛型
上次說到函數入參支持協變,出參支持逆變。那麼Java中是如何實現支持的?
一切都可以歸因於Java的前向相容,Java泛型是一個殘缺品,不過也可以解決大量的泛型問題。
Java中對象聲明並不支持協變和逆變,所以我們看到的函數介面聲明如下:
// R - Result
@FunctionalInterface
public interface Function<T, R> {
// 1. 函數式介面
R apply(T t);
// 2. compose 和 andThen 實現函數複合
// compose 的入參函數 before 支持入參逆變,出參協變
default <V> Function<V, R> compose(Function<? super V, ? extends T> before) {
Objects.requireNonNull(before);
return (V v) -> apply(before.apply(v));
}
default <V> Function<T, V> andThen(Function<? super R, ? extends V> after) {
Objects.requireNonNull(after);
return (T t) -> after.apply(apply(t));
}
// Java9 支持的靜態方法
static <T> Function<T, T> identity() {
return t -> t;
}
}
Java中僅在使用時支持逆變與協變的匹配,可以在方法上使用通配符,也就是說,andThen方法接受的參數支持入參逆變、出參協變。不使用通配符則為不變,在IDEA中可以開啟通配符的提示,很有用,一般情況下,編寫時可以考慮不變,然後再考慮增加逆變與協變的支持。
但是Java中通配符使用了和繼承相關的super、 extends 關鍵字,而實際協變與逆變和繼承沒有關係。在scala中協變和逆變可以簡單地寫作+和-,比如聲明List[+T]。
通配符繼承了Java一貫的繁瑣,函數聲明更甚。函數的入參和出參都在泛型參數中,Function<T, R> 和 T → R 相比誰更簡潔一目瞭然。特別是定義高階函數(入參或出參為函數的函數)更為麻煩,比如一個簡單的加法:
// Java 中的聲明,可以這樣考慮:Function泛型參數的右邊為返回值
Function<Integer, Function<Integer, Integer>> add;
// 使用時連續傳入兩個參數
add.apply(1).apply(2);
// 其他語言
val add : Int -> Int -> Int = x -> y -> x + y
add(1)(2)
// 傳入 tuple 的等價形式 Java
Function<Tuple<Integer, Integer>, Integer> add = (x, y) -> x + y;
add.apply(new Tuple(1, 2));
BiFunction<Integer, Integer, Integer> add = (x, y) -> x + y;
add.apply(1, 2);
// 其他語言
val add: (Int, Int) -> Int = x + y
add(1, 2)
從上面可以看出,雖然實現的是相同的語義,Java對函數的支持還是有明顯不足的。沒有原生的Tuple類型,但是在使用時又可以使用 (x, y)。
話雖如此,畢竟可以實現相同的功能,豐富的類庫加之方法引用、lambda表達式等的存在,Java中使用函數式編程思想可以說是如虎添翼。
三人成虎
理解函數式思想實際上只需要瞭解三種函數式介面,生產者、函數、消費者。只有生產者和消費者可以有副作用,函數就是純函數。
Function<T, R>
public interface Supplier<T> {
T get();
}
public interface Consumer<T> {
void accept(T t);
// 多次消費合併為一次
default Consumer<T> andThen(Consumer<? super T> after) {
Objects.requireNonNull(after);
return (T t) -> { accept(t); after.accept(t); };
}
}
函數式編程將操作都通過鏈式調用連接起來。
Supplier → Func1 → … → Funcn → Consumer
比如stream流的整個生命周期,只消費一次。
// Stream
Stream.of("apple", "orange")
.map(String::toUpperCase)
.forEach(System.out::println);
// reactor, 簡單理解為stream++, 支持非同步 + 背壓
Flux.just(1, 2, 3, 4)
.log()
.map(i -> i * 2)
.zipWith(Flux.range(0, Integer.MAX_VALUE),
(one, two) -> String.format("First Flux: %d, Second Flux: %d", one, two))
.subscribe(elements::add);
assertThat(elements).containsExactly(
"First Flux: 2, Second Flux: 0",
"First Flux: 4, Second Flux: 1",
"First Flux: 6, Second Flux: 2",
"First Flux: 8, Second Flux: 3");
常見的使用舉例
- Comparable
舉例來說,實現 集合類的sort方法,方法簽名如下:
// 最簡單的聲明
public static <T> void sort(Collection<T> col);
// 加入可比較約束,編譯器檢查:如果沒有實現Comparable,則編譯不通過
public static <T extends Comparable<T>> void sort(Collection<T> col);
// 使用通配符匹配更多使用場景,大多數類庫都是這樣聲明的,缺點是看起了比較繁瑣
// 其實只需要理解了函數的入參逆變,出參協變的準則,關註extends、super後面的類型即可理解
public static <T extends Comparable<? super T>> void sort(Collection<T> col);
- Stream
這個方法聲明在Stream介面中,可以把Stream<Stream
public interface Stream<T> extends BaseStream<T, Stream<T>> {
Stream<T> filter(Predicate<? super T> predicate);
<R> Stream<R> map(Function<? super T, ? extends R> mapper);
// flatMap 把 Stream<Stream<T>> 展開,也有叫 bind 的。
<R> Stream<R> flatMap(Function<? super T, ? extends Stream<? extends R>> mapper);
}
可以看看flatMap中mapper的返回類型,完美遵循出參協變和集合類支持協變的特性。
你看,本來Stream