基本涉及到了 interface 的方方面面,有例子、有源碼分析、有彙編分析。直接從 10 個問題出發,深度解答。 ...
目錄
- 1. Go 語言與鴨子類型的關係
- 2. 值接收者和指針接收者的區別
- 3. iface 和 eface 的區別是什麼
- 4. 介面的動態類型和動態值
- 5. 編譯器自動檢測類型是否實現介面
- 6. 介面的構造過程是怎樣的
- 7. 類型轉換和斷言的區別
- 8. 介面轉換的原理
- 9. 如何用 interface 實現多態
- 10. Go 介面與 C++ 介面有何異同
- 參考資料
這次文章依然很長,基本上涵蓋了 interface
的方方面面,有例子,有源碼分析,有彙編分析,前前後後寫了 20 多天。洋洋灑灑,長篇大論,依然有些東西沒有涉及到,比如文章里沒有寫到反射
,當然,後面會單獨寫一篇關於反射
的文章,這是後話。
還是希望看你在看完文章後能有所收穫,有任何問題或意見建議,歡迎在文章後面留言。
這篇文章的架構比較簡單,直接拋出 10 個問題,一一解答。
1. Go 語言與鴨子類型的關係
先直接來看維基百科里的定義:
If it looks like a duck, swims like a duck, and quacks like a duck, then it probably is a duck.
翻譯過來就是:如果某個東西長得像鴨子,像鴨子一樣游泳,像鴨子一樣嘎嘎叫,那它就可以被看成是一隻鴨子。
Duck Typing
,鴨子類型,是動態編程語言的一種對象推斷策略,它更關註對象能如何被使用,而不是對象的類型本身。Go 語言作為一門靜態語言,它通過通過介面的方式完美支持鴨子類型。
例如,在動態語言 python 中,定義一個這樣的函數:
def hello_world(coder):
coder.say_hello()
當調用此函數的時候,可以傳入任意類型,只要它實現了 say_hello()
函數就可以。如果沒有實現,運行過程中會出現錯誤。
而在靜態語言如 Java, C++ 中,必須要顯示地聲明實現了某個介面,之後,才能用在任何需要這個介面的地方。如果你在程式中調用 hello_world
函數,卻傳入了一個根本就沒有實現 say_hello()
的類型,那在編譯階段就不會通過。這也是靜態語言比動態語言更安全的原因。
動態語言和靜態語言的差別在此就有所體現。靜態語言在編譯期間就能發現類型不匹配的錯誤,不像動態語言,必須要運行到那一行代碼才會報錯。插一句,這也是我不喜歡用 python
的一個原因。當然,靜態語言要求程式員在編碼階段就要按照規定來編寫程式,為每個變數規定數據類型,這在某種程度上,加大了工作量,也加長了代碼量。動態語言則沒有這些要求,可以讓人更專註在業務上,代碼也更短,寫起來更快,這一點,寫 python 的同學比較清楚。
Go 語言作為一門現代靜態語言,是有後發優勢的。它引入了動態語言的便利,同時又會進行靜態語言的類型檢查,寫起來是非常 Happy 的。Go 採用了折中的做法:不要求類型顯示地聲明實現了某個介面,只要實現了相關的方法即可,編譯器就能檢測到。
來看個例子:
先定義一個介面,和使用此介面作為參數的函數:
type IGreeting interface {
sayHello()
}
func sayHello(i IGreeting) {
i.sayHello()
}
再來定義兩個結構體:
type Go struct {}
func (g Go) sayHello() {
fmt.Println("Hi, I am GO!")
}
type PHP struct {}
func (p PHP) sayHello() {
fmt.Println("Hi, I am PHP!")
}
最後,在 main 函數里調用 sayHello() 函數:
func main() {
golang := Go{}
php := PHP{}
sayHello(golang)
sayHello(php)
}
程式輸出:
Hi, I am GO!
Hi, I am PHP!
在 main 函數中,調用調用 sayHello() 函數時,傳入了 golang, php
對象,它們並沒有顯式地聲明實現了 IGreeting 類型,只是實現了介面所規定的 sayHello() 函數。實際上,編譯器在調用 sayHello() 函數時,會隱式地將 golang, php
對象轉換成 IGreeting 類型,這也是靜態語言的類型檢查功能。
順帶再提一下動態語言的特點:
變數綁定的類型是不確定的,在運行期間才能確定
函數和方法可以接收任何類型的參數,且調用時不檢查參數類型
不需要實現介面
總結一下,鴨子類型是一種動態語言的風格,在這種風格中,一個對象有效的語義,不是由繼承自特定的類或實現特定的介面,而是由它"當前方法和屬性的集合"決定。Go 作為一種靜態語言,通過介面實現了 鴨子類型
,實際上是 Go 的編譯器在其中作了隱匿的轉換工作。
2. 值接收者和指針接收者的區別
方法
方法能給用戶自定義的類型添加新的行為。它和函數的區別在於方法有一個接收者,給一個函數添加一個接收者,那麼它就變成了方法。接收者可以是值接收者
,也可以是指針接收者
。
在調用方法的時候,值類型既可以調用值接收者
的方法,也可以調用指針接收者
的方法;指針類型既可以調用指針接收者
的方法,也可以調用值接收者
的方法。
也就是說,不管方法的接收者是什麼類型,該類型的值和指針都可以調用,不必嚴格符合接收者的類型。
來看個例子:
package main
import "fmt"
type Person struct {
age int
}
func (p Person) howOld() int {
return p.age
}
func (p *Person) growUp() {
p.age += 1
}
func main() {
// qcrao 是值類型
qcrao := Person{age: 18}
// 值類型 調用接收者也是值類型的方法
fmt.Println(qcrao.howOld())
// 值類型 調用接收者是指針類型的方法
qcrao.growUp()
fmt.Println(qcrao.howOld())
// ----------------------
// stefno 是指針類型
stefno := &Person{age: 100}
// 指針類型 調用接收者是值類型的方法
fmt.Println(stefno.howOld())
// 指針類型 調用接收者也是指針類型的方法
stefno.growUp()
fmt.Println(stefno.howOld())
}
上例子的輸出結果是:
18
19
100
101
調用了 growUp
函數後,不管調用者是值類型還是指針類型,它的 Age
值都改變了。
實際上,當類型和方法的接收者類型不同時,其實是編譯器在背後做了一些工作,用一個表格來呈現:
- | 值接收者 | 指針接收者 |
---|---|---|
值類型調用者 | 方法會使用調用者的一個副本,類似於“傳值” | 使用值的引用來調用方法,上例中,qcrao.growUp() 實際上是 (&qcrao).growUp() |
指針類型調用者 | 指針被解引用為值,上例中,stefno.howOld() 實際上是 (*stefno).howOld() |
實際上也是“傳值”,方法里的操作會影響到調用者,類似於指針傳參,拷貝了一份指針 |
值接收者和指針接收者
前面說過,不管接收者類型是值類型還是指針類型,都可以通過值類型或指針類型調用,這裡面實際上通過語法糖起作用的。
先說結論:實現了接收者是值類型的方法,相當於自動實現了接收者是指針類型的方法;而實現了接收者是指針類型的方法,不會自動生成對應接收者是值類型的方法。
來看一個例子,就會完全明白:
package main
import "fmt"
type coder interface {
code()
debug()
}
type Gopher struct {
language string
}
func (p Gopher) code() {
fmt.Printf("I am coding %s language\n", p.language)
}
func (p *Gopher) debug() {
fmt.Printf("I am debuging %s language\n", p.language)
}
func main() {
var c coder = &Gopher{"Go"}
c.code()
c.debug()
}
上述代碼里定義了一個介面 coder
,介面定義了兩個函數:
code()
debug()
接著定義了一個結構體 Gopher
,它實現了兩個方法,一個值接收者,一個指針接收者。
最後,我們在 main
函數里通過介面類型的變數調用了定義的兩個函數。
運行一下,結果:
I am coding Go language
I am debuging Go language
但是如果我們把 main
函數的第一條語句換一下:
func main() {
var c coder = Gopher{"Go"}
c.code()
c.debug()
}
運行一下,報錯:
./main.go:23:6: cannot use Gopher literal (type Gopher) as type coder in assignment:
Gopher does not implement coder (debug method has pointer receiver)
看出這兩處代碼的差別了嗎?第一次是將 &Gopher
賦給了 coder
;第二次則是將 Gopher
賦給了 coder
。
第二次報錯是說,Gopher
沒有實現 coder
。很明顯了吧,因為 Gopher
類型並沒有實現 debug
方法;錶面上看, *Gopher
類型也沒有實現 code
方法,但是因為 Gopher
類型實現了 code
方法,所以讓 *Gopher
類型自動擁有了 code
方法。
當然,上面的說法有一個簡單的解釋:接收者是指針類型的方法,很可能在方法中會對接收者的屬性進行更改操作,從而影響接收者;而對於接收者是值類型的方法,在方法中不會對接收者本身產生影響。
所以,當實現了一個接收者是值類型的方法,就可以自動生成一個接收者是對應指針類型的方法,因為兩者都不會影響接收者。但是,當實現了一個接收者是指針類型的方法,如果此時自動生成一個接收者是值類型的方法,原本期望對接收者的改變(通過指針實現),現在無法實現,因為值類型會產生一個拷貝,不會真正影響調用者。
最後,只要記住下麵這點就可以了:
如果實現了接收者是值類型的方法,會隱含地也實現了接收者是指針類型的方法。
兩者分別在何時使用
如果方法的接收者是值類型,無論調用者是對象還是對象指針,修改的都是對象的副本,不影響調用者;如果方法的接收者是指針類型,則調用者修改的是指針指向的對象本身。
使用指針作為方法的接收者的理由:
- 方法能夠修改接收者指向的值。
- 避免在每次調用方法時複製該值,在值的類型為大型結構體時,這樣做會更加高效。
是使用值接收者還是指針接收者,不是由該方法是否修改了調用者(也就是接收者)來決定,而是應該基於該類型的本質
。
如果類型具備“原始的本質”,也就是說它的成員都是由 Go 語言里內置的原始類型,如字元串,整型值等,那就定義值接收者類型的方法。像內置的引用類型,如 slice,map,interface,channel,這些類型比較特殊,聲明他們的時候,實際上是創建了一個 header
, 對於他們也是直接定義值接收者類型的方法。這樣,調用函數時,是直接 copy 了這些類型的 header
,而 header
本身就是為複製設計的。
如果類型具備非原始的本質,不能被安全地複製,這種類型總是應該被共用,那就定義指針接收者的方法。比如 go 源碼里的文件結構體(struct File)就不應該被覆制,應該只有一份實體
。
這一段說的比較繞,大家可以去看《Go 語言實戰》5.3 那一節。
3. iface 和 eface 的區別是什麼
iface
和 eface
都是 Go 中描述介面的底層結構體,區別在於 iface
描述的介面包含方法,而 eface
則是不包含任何方法的空介面:interface{}
。
從源碼層面看一下:
type iface struct {
tab *itab
data unsafe.Pointer
}
type itab struct {
inter *interfacetype
_type *_type
link *itab
hash uint32 // copy of _type.hash. Used for type switches.
bad bool // type does not implement interface
inhash bool // has this itab been added to hash?
unused [2]byte
fun [1]uintptr // variable sized
}
iface
內部維護兩個指針,tab
指向一個 itab
實體, 它表示介面的類型以及賦給這個介面的實體類型。data
則指向介面具體的值,一般而言是一個指向堆記憶體的指針。
再來仔細看一下 itab
結構體:_type
欄位描述了實體的類型,包括記憶體對齊方式,大小等;inter
欄位則描述了介面的類型。fun
欄位放置和介面方法對應的具體數據類型的方法地址,實現介面調用方法的動態分派,一般在每次給介面賦值發生轉換時會更新此表,或者直接拿緩存的 itab。
這裡只會列出實體類型和介面相關的方法,實體類型的其他方法並不會出現在這裡。如果你學過 C++ 的話,這裡可以類比虛函數的概念。
另外,你可能會覺得奇怪,為什麼 fun
數組的大小為 1,要是介面定義了多個方法可怎麼辦?實際上,這裡存儲的是第一個方法的函數指針,如果有更多的方法,在它之後的記憶體空間里繼續存儲。從彙編角度來看,通過增加地址就能獲取到這些函數指針,沒什麼影響。順便提一句,這些方法是按照函數名稱的字典序進行排列的。
再看一下 interfacetype
類型,它描述的是介面的類型:
type interfacetype struct {
typ _type
pkgpath name
mhdr []imethod
}
可以看到,它包裝了 _type
類型,_type
實際上是描述 Go 語言中各種數據類型的結構體。我們註意到,這裡還包含一個 mhdr
欄位,表示介面所定義的函數列表, pkgpath
記錄定義了介面的包名。
這裡通過一張圖來看下 iface
結構體的全貌:
接著來看一下 eface
的源碼:
type eface struct {
_type *_type
data unsafe.Pointer
}
相比 iface
,eface
就比較簡單了。只維護了一個 _type
欄位,表示空介面所承載的具體的實體類型。data
描述了具體的值。
我們來看個例子:
package main
import "fmt"
func main() {
x := 200
var any interface{} = x
fmt.Println(any)
g := Gopher{"Go"}
var c coder = g
fmt.Println(c)
}
type coder interface {
code()
debug()
}
type Gopher struct {
language string
}
func (p Gopher) code() {
fmt.Printf("I am coding %s language\n", p.language)
}
func (p Gopher) debug() {
fmt.Printf("I am debuging %s language\n", p.language)
}
執行命令,列印出彙編語言:
go tool compile -S ./src/main.go
可以看到,main 函數里調用了兩個函數:
func convT2E64(t *_type, elem unsafe.Pointer) (e eface)
func convT2I(tab *itab, elem unsafe.Pointer) (i iface)
上面兩個函數的參數和 iface
及 eface
結構體的欄位是可以聯繫起來的:兩個函數都是將參數組裝
一下,形成最終的介面。
作為補充,我們最後再來看下 _type
結構體:
type _type struct {
// 類型大小
size uintptr
ptrdata uintptr
// 類型的 hash 值
hash uint32
// 類型的 flag,和反射相關
tflag tflag
// 記憶體對齊相關
align uint8
fieldalign uint8
// 類型的編號,有bool, slice, struct 等等等等
kind uint8
alg *typeAlg
// gc 相關
gcdata *byte
str nameOff
ptrToThis typeOff
}
Go 語言各種數據類型都是在 _type
欄位的基礎上,增加一些額外的欄位來進行管理的:
type arraytype struct {
typ _type
elem *_type
slice *_type
len uintptr
}
type chantype struct {
typ _type
elem *_type
dir uintptr
}
type slicetype struct {
typ _type
elem *_type
}
type structtype struct {
typ _type
pkgPath name
fields []structfield
}
這些數據類型的結構體定義,是反射實現的基礎。
4. 介面的動態類型和動態值
從源碼里可以看到:iface
包含兩個欄位:tab
是介面表指針,指向類型信息;data
是數據指針,則指向具體的數據。它們分別被稱為動態類型
和動態值
。而介面值包括動態類型
和動態值
。
【引申1】介面類型和 nil
作比較
介面值的零值是指動態類型
和動態值
都為 nil
。當僅且當這兩部分的值都為 nil
的情況下,這個介面值就才會被認為 介面值 == nil
。
來看個例子:
package main
import "fmt"
type Coder interface {
code()
}
type Gopher struct {
name string
}
func (g Gopher) code() {
fmt.Printf("%s is coding\n", g.name)
}
func main() {
var c Coder
fmt.Println(c == nil)
fmt.Printf("c: %T, %v\n", c, c)
var g *Gopher
fmt.Println(g == nil)
c = g
fmt.Println(c == nil)
fmt.Printf("c: %T, %v\n", c, c)
}
輸出:
true
c: <nil>, <nil>
true
false
c: *main.Gopher, <nil>
一開始,c
的 動態類型和動態值都為 nil
,g
也為 nil
,當把 g
賦值給 c
後,c
的動態類型變成了 *main.Gopher
,僅管 c
的動態值仍為 nil
,但是當 c
和 nil
作比較的時候,結果就是 false
了。
【引申2】
來看一個例子,看一下它的輸出:
package main
import "fmt"
type MyError struct {}
func (i MyError) Error() string {
return "MyError"
}
func main() {
err := Process()
fmt.Println(err)
fmt.Println(err == nil)
}
func Process() error {
var err *MyError = nil
return err
}
函數運行結果:
<nil>
false
這裡先定義了一個 MyError
結構體,實現了 Error
函數,也就實現了 error
介面。Process
函數返回了一個 error
介面,這塊隱含了類型轉換。所以,雖然它的值是 nil
,其實它的類型是 *MyError
,最後和 nil
比較的時候,結果為 false
。
【引申3】如何列印出介面的動態類型和值?
直接看代碼:
package main
import (
"unsafe"
"fmt"
)
type iface struct {
itab, data uintptr
}
func main() {
var a interface{} = nil
var b interface{} = (*int)(nil)
x := 5
var c interface{} = (*int)(&x)
ia := *(*iface)(unsafe.Pointer(&a))
ib := *(*iface)(unsafe.Pointer(&b))
ic := *(*iface)(unsafe.Pointer(&c))
fmt.Println(ia, ib, ic)
fmt.Println(*(*int)(unsafe.Pointer(ic.data)))
}
代碼里直接定義了一個 iface
結構體,用兩個指針來描述 itab
和 data
,之後將 a, b, c 在記憶體中的內容強制解釋成我們自定義的 iface
。最後就可以列印出動態類型和動態值的地址。
運行結果如下:
{0 0} {17426912 0} {17426912 842350714568}
5
a 的動態類型和動態值的地址均為 0,也就是 nil;b 的動態類型和 c 的動態類型一致,都是 *int
;最後,c 的動態值為 5。
5. 編譯器自動檢測類型是否實現介面
經常看到一些開源庫里會有一些類似下麵這種奇怪的用法:
var _ io.Writer = (*myWriter)(nil)
這時候會有點懵,不知道作者想要乾什麼,實際上這就是此問題的答案。編譯器會由此檢查 *myWriter
類型是否實現了 io.Writer
介面。
來看一個例子:
package main
import "io"
type myWriter struct {
}
/*func (w myWriter) Write(p []byte) (n int, err error) {
return
}*/
func main() {
// 檢查 *myWriter 類型是否實現了 io.Writer 介面
var _ io.Writer = (*myWriter)(nil)
// 檢查 myWriter 類型是否實現了 io.Writer 介面
var _ io.Writer = myWriter{}
}
註釋掉為 myWriter 定義的 Write 函數後,運行程式:
src/main.go:14:6: cannot use (*myWriter)(nil) (type *myWriter) as type io.Writer in assignment:
*myWriter does not implement io.Writer (missing Write method)
src/main.go:15:6: cannot use myWriter literal (type myWriter) as type io.Writer in assignment:
myWriter does not implement io.Writer (missing Write method)
報錯信息:*myWriter/myWriter 未實現 io.Writer 介面,也就是未實現 Write 方法。
解除註釋後,運行程式不報錯。
實際上,上述賦值語句會發生隱式地類型轉換,在轉換的過程中,編譯器會檢測等號右邊的類型是否實現了等號左邊介面所規定的函數。
總結一下,可通過在代碼中添加類似如下的代碼,用來檢測類型是否實現了介面:
var _ io.Writer = (*myWriter)(nil)
var _ io.Writer = myWriter{}
6. 介面的構造過程是怎樣的
我們已經看過了 iface
和 eface
的源碼,知道 iface
最重要的是 itab
和 _type
。
為了研究清楚介面是如何構造的,接下來我會拿起彙編的武器,還原背後的真相。
來看一個示例代碼:
package main
import "fmt"
type Person interface {
growUp()
}
type Student struct {
age int
}
func (p Student) growUp() {
p.age += 1
return
}
func main() {
var qcrao = Person(Student{age: 18})
fmt.Println(qcrao)
}
執行命令:
go tool compile -S main.go
得到 main 函數的彙編代碼如下:
0x0000 00000 (./src/main.go:30) TEXT "".main(SB), $80-0
0x0000 00000 (./src/main.go:30) MOVQ (TLS), CX
0x0009 00009 (./src/main.go:30) CMPQ SP, 16(CX)
0x000d 00013 (./src/main.go:30) JLS 157
0x0013 00019 (./src/main.go:30) SUBQ $80, SP
0x0017 00023 (./src/main.go:30) MOVQ BP, 72(SP)
0x001c 00028 (./src/main.go:30) LEAQ 72(SP), BP
0x0021 00033 (./src/main.go:30) FUNCDATA$0, gclocals·69c1753bd5f81501d95132d08af04464(SB)
0x0021 00033 (./src/main.go:30) FUNCDATA$1, gclocals·e226d4ae4a7cad8835311c6a4683c14f(SB)
0x0021 00033 (./src/main.go:31) MOVQ $18, ""..autotmp_1+48(SP)
0x002a 00042 (./src/main.go:31) LEAQ go.itab."".Student,"".Person(SB), AX
0x0031 00049 (./src/main.go:31) MOVQ AX, (SP)
0x0035 00053 (./src/main.go:31) LEAQ ""..autotmp_1+48(SP), AX
0x003a 00058 (./src/main.go:31) MOVQ AX, 8(SP)
0x003f 00063 (./src/main.go:31) PCDATA $0, $0
0x003f 00063 (./src/main.go:31) CALL runtime.convT2I64(SB)
0x0044 00068 (./src/main.go:31) MOVQ 24(SP), AX
0x0049 00073 (./src/main.go:31) MOVQ 16(SP), CX
0x004e 00078 (./src/main.go:33) TESTQ CX, CX
0x0051 00081 (./src/main.go:33) JEQ 87
0x0053 00083 (./src/main.go:33) MOVQ 8(CX), CX
0x0057 00087 (./src/main.go:33) MOVQ $0, ""..autotmp_2+56(SP)
0x0060 00096 (./src/main.go:33) MOVQ $0, ""..autotmp_2+64(SP)
0x0069 00105 (./src/main.go:33) MOVQ CX, ""..autotmp_2+56(SP)
0x006e 00110 (./src/main.go:33) MOVQ AX, ""..autotmp_2+64(SP)
0x0073 00115 (./src/main.go:33) LEAQ ""..autotmp_2+56(SP), AX
0x0078 00120 (./src/main.go:33) MOVQ AX, (SP)
0x007c 00124 (./src/main.go:33) MOVQ $1, 8(SP)
0x0085 00133 (./src/main.go:33) MOVQ $1, 16(SP)
0x008e 00142 (./src/main.go:33) PCDATA $0, $1
0x008e 00142 (./src/main.go:33) CALL fmt.Println(SB)
0x0093 00147 (./src/main.go:34) MOVQ 72(SP), BP
0x0098 00152 (./src/main.go:34) ADDQ $80, SP
0x009c 00156 (./src/main.go:34) RET
0x009d 00157 (./src/main.go:34) NOP
0x009d 00157 (./src/main.go:30) PCDATA $0, $-1
0x009d 00157 (./src/main.go:30) CALL runtime.morestack_noctxt(SB)
0x00a2 00162 (./src/main.go:30) JMP 0
我們從第 10 行開始看,如果不理解前面幾行彙編代碼的話,可以回去看看公眾號前面兩篇文章,這裡我就省略了。
彙編行數 | 操作 |
---|---|
10-14 | 構造調用 runtime.convT2I64(SB) 的參數 |
我們來看下這個函數的參數形式:
func convT2I64(tab *itab, elem unsafe.Pointer) (i iface) {
// ……
}
convT2I64
會構造出一個 inteface
,也就是我們的 Person
介面。
第一個參數的位置是 (SP)
,這裡被賦上了 go.itab."".Student,"".Person(SB)
的地址。
我們從生成的彙編找到:
go.itab."".Student,"".Person SNOPTRDATA dupok size=40
0x0000 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0x0010 00 00 00 00 00 00 00 00 da 9f 20 d4
rel 0+8 t=1 type."".Person+0
rel 8+8 t=1 type."".Student+0
size=40
大小為40位元組,回顧一下:
type itab struct {
inter *interfacetype // 8位元組
_type *_type // 8位元組
link *itab // 8位元組
hash uint32 // 4位元組
bad bool // 1位元組
inhash bool // 1位元組
unused [2]byte // 2位元組
fun [1]uintptr // variable sized // 8位元組
}
把每個欄位的大小相加,itab
結構體的大小就是 40 位元組。上面那一串數字實際上是 itab
序列化後的內容,註意到大部分數字是 0,從 24 位元組開始的 4 個位元組 da 9f 20 d4
實際上是 itab
的 hash
值,這在判斷兩個類型是否相同的時候會用到。
下麵兩行是鏈接指令,簡單說就是將所有源文件綜合起來,給每個符號賦予一個全局的位置值。這裡的意思也比較明確:前8個位元組最終存儲的是 type."".Person
的地址,對應 itab
里的 inter
欄位,表示介面類型;8-16 位元組最終存儲的是 type."".Student
的地址,對應 itab
里 _type
欄位,表示具體類型。
第二個參數就比較簡單了,它就是數字 18
的地址,這也是初始化 Student
結構體的時候會用到。
彙編行數 | 操作 |
---|---|
15 | 調用 runtime.convT2I64(SB) |
具體看下代碼:
func convT2I64(tab *itab, elem unsafe.Pointer) (i iface) {
t := tab._type
//...
var x unsafe.Pointer
if *(*uint64)(elem) == 0 {
x = unsafe.Pointer(&zeroVal[0])
} else {
x = mallocgc(8, t, false)
*(*uint64)(x) = *(*uint64)(elem)
}
i.tab = tab
i.data = x
return
}
這塊代碼比較簡單,把 tab
賦給了 iface
的 tab
欄位;data
部分則是在堆上申請了一塊記憶體,然後將 elem
指向的 18
拷貝過去。這樣 iface
就組裝好了。
彙編行數 | 操作 |
---|---|
17 | 把 i.tab 賦給 CX |
18 | 把 i.data 賦給 AX |
19-21 | 檢測 i.tab 是否是 nil,如果不是的話,把 CX 移動 8 個位元組,也就是把 itab 的 _type 欄位賦給了 CX,這也是介面的實體類型,最終要作為 fmt.Println 函數的參數 |
後面,就是調用 fmt.Println
函數及之前的參數準備工作了,不再贅述。
這樣,我們就把一個 interface
的構造過程說完了。
【引申1】
如何列印出介面類型的 Hash
值?
這裡參考曹大神翻譯的一篇文章,參考資料里會寫上。具體做法如下:
type iface struct {
tab *itab
data unsafe.Pointer
}
type itab struct {
inter uintptr
_type uintptr
link uintptr
hash uint32
_ [4]byte
fun [1]uintptr
}
func main() {
var qcrao = Person(Student{age: 18})
iface := (*iface)(unsafe.Pointer(&qcrao))
fmt.Printf("iface.tab.hash = %#x\n", iface.tab.hash)
}
定義了一個山寨版
的 iface
和 itab
,說它山寨
是因為 itab
里的一些關鍵數據結構都不具體展開了,比如 _type
,對比一下正宗的定義就可以發現,但是山寨版
依然能工作,因為 _type
就是一個指針而已嘛。
在 main
函數里,先構造出一個介面對象 qcrao
,然後強制類型轉換,最後讀取出 hash
值,非常妙!你也可以自己動手試一下。
運行結果:
iface.tab.hash = 0xd4209fda
值得一提的是,構造介面 qcrao
的時候,即使我把 age
寫成其他值,得到的 hash
值依然不變的,這應該是可以預料的,hash
值只和他的欄位、方法相關。
7. 類型轉換和斷言的區別
我們知道,Go 語言中不允許隱式類型轉換,也就是說 =
兩邊,不允許出現類型不相同的變數。
類型轉換
、類型斷言
本質都是把一個類型轉換成另外一個類型。不同之處在於,類型斷言是對介面變數進行的操作。
類型轉換
對於類型轉換
而言,轉換前後的兩個類型要相互相容才行。類型轉換的語法為:
<結果類型> := <目標類型> ( <表達式> )
package main
import "fmt"
func main() {
var i int = 9
var f float64
f = float64(i)
fmt.Printf("%T, %v\n", f, f)
f = 10.8
a := int(f)
fmt.Printf("%T, %v\n", a, a)
// s := []int(i)
}
上面的代碼里,我定義了一個 int
型和 float64
型的變數,嘗試在它們之前相互轉換,結果是成功的:int
型和 float64
是相互相容的。
如果我把最後一行代碼的註釋去掉,編譯器會報告類型不相容的錯誤:
cannot convert i (type int) to type []int
斷言
前面說過,因為空介面 interface{}
沒有定義任何函數,因此 Go 中所有類型都實現了空介面。當一個函數的形參是 interface{}
,那麼在函數中,需要對形參進行斷言,從而得到它的真實類型。
斷言的語法為:
<目標類型的值>,<布爾參數> := <表達式>.( 目標類型 ) // 安全類型斷言
<目標類型的值> := <表達式>.( 目標類型 ) //非安全類型斷言
類型轉換和類型斷言有些相似,不同之處,在於類型斷言是對介面進行的操作。
還是來看一個簡短的例子:
package main
import "fmt"
type Student struct {
Name string
Age int
}
func main() {
var i interface{} = new(Student)
s := i.(Student)
fmt.Println(s)
}
運行一下:
panic: interface conversion: interface {} is *main.Student, not main.Student
直接 panic
了,這是因為 i
是 *Student
類型,並非 Student
類型,斷言失敗。這裡直接發生了 panic
,線上代碼可能並不適合這樣做,可以採用“安全斷言”的語法:
func main() {
var i interface{} = new(Student)
s, ok := i.(Student)
if ok {
fmt.Println(s)
}
}
這樣,即使斷言失敗也不會 panic
。
斷言其實還有另一種形式,就是用在利用 switch
語句判斷介面的類型。每一個 case
會被順序地考慮。當命中一個 case
時,就會執行 case
中的語句,因此 case
語句的順序是很重要的,因為很有可能會有多個 case
匹配的情況。
代碼示例如下:
func main() {
//var i interface{} = new(Student)
//var i interface{} = (*Student)(nil)
var i interface{}
fmt.Printf("%p %v\n", &i, i)
judge(i)
}
func judge(v interface{}) {
fmt.Printf("%p %v\n", &v, v)
switch v := v.(type) {
case nil:
fmt.Printf("%p %v\n", &v, v)
fmt.Printf("nil type[%T] %v\n", v, v)
case Student:
fmt.Printf("%p %v\n", &v, v)
fmt.Printf("Student type[%T] %v\n", v, v)
case *Student:
fmt.Printf("%p %v\n", &v, v)
fmt.Printf("*Student type[%T] %v\n", v, v)
default:
fmt.Printf("%p %v\n", &v, v)
fmt.Printf("unknow\n")
}
}
type Student struct {
Name string
Age int
}
main
函數里有三行不同的聲明,每次運行一行,註釋另外兩行,得到三組運行結果:
// --- var i interface{} = new(Student)
0xc4200701b0 [Name: ], [Age: 0]
0xc4200701d0 [Name: ], [Age: 0]
0xc420080020 [Name: ], [Age: 0]
*Student type[*main.Student] [Name: ], [Age: 0]
// --- var i interface{} = (*Student)(nil)
0xc42000e1d0 <nil>
0xc42000e1f0 <nil>
0xc42000c030 <nil>
*Student type[*main.Student] <nil>
// --- var i interface{}
0xc42000e1d0 <nil>
0xc42000e1e0 <nil>
0xc42000e1f0 <nil>
nil type[<nil>] <nil>
對於第一行語句:
var i interface{} = new(Student)
i
是一個 *Student
類型,匹配上第三個 case,從列印的三個地址來看,這三處的變數實際上都是不一樣的。在 main
函數里有一個局部變數 i
;調用函數時,實際上是複製了一份參數,因此函數里又有一個變數 v
,它是 i
的拷貝;斷言之後,又生成了一份新的拷貝。所以最終列印的三個變數的地址都不一樣。
對於第二行語句:
var i interface{} = (*Student)(nil)
這裡想說明的其實是 i
在這裡動態類型是 (*Student)
, 數據為 nil
,它的類型並不是 nil
,它與 nil
作比較的時候,得到的結果也是 false
。
最後一行語句:
var i interface{}
這回 i
才是 nil
類型。
【引申1】
fmt.Println
函數的參數是 interface
。對於內置類型,函數內部會用窮舉法,得出它的真實類型,然後轉換為字元串列印。而對於自定義類型,首先確定該類型是否實現了 String()
方法,如果實現了,則直接列印輸出 String()
方法的結果;否則,會通過反射來遍歷對象的成員進行列印。
再來看一個簡短的例子,比較簡單,不要緊張:
package main
import "fmt"
type Student struct {
Name string
Age int
}
func main() {
var s = Student{
Name: "qcrao",
Age: 18,
}
fmt.Println(s)
}
因為 Student
結構體沒有實現 String()
方法,所以 fmt.Println
會利用反射挨個列印成員變數:
{qcrao 18}
增加一個 String()
方法的實現:
func (s Student) String() string {
return fmt.Sprintf("[Name: %s], [Age: %d]", s.Name, s.Age)
}
列印結果:
[Name: qcrao], [Age: 18]
按照我們自定義的方法來列印了。
【引申2】
針對上面的例子,如果改一下:
func (s *Student) String() string {
return fmt.Sprintf("[Name: %s], [Age: %d]", s.Name, s.Age)
}
註意看兩個函數的接受者類型不同,現在 Student
結構體只有一個接受者類型為 指針類型
的 String()
函數,列印結果:
{qcrao 18}
為什麼?
類型
T
只有接受者是T
的方法;而類型*T
擁有接受者是T
和*T
的方法。語法上T
能直接調*T
的方法僅僅是Go
的語法糖。
所以, Student
結構體定義了接受者類型是值類型的 String()
方法時,通過
fmt.Println(s)
fmt.Println(&s)
均可以按照自定義的格式來列印。
如果 Student
結構體定義了接受者類型是指針類型的 String()
方法時,只有通過
fmt.Println(&s)
才能按照自定義的格式列印。
8. 介面轉換的原理
通過前面提到的 iface
的源碼可以看到,實際上它包含介面的類型 interfacetype
和 實體類型的類型 _type
,這兩者都是 iface
的欄位 itab
的成員。也就是說生成一個 itab
同時需要介面的類型和實體的類型。
<interface 類型, 實體類型> ->itable
當判定一種類型是否滿足某個介面時,Go 使用類型的方法集和介面所需要的方法集進行匹配,如果類型的方法集完全包含介面的方法集,則可認為該類型實現了該介面。
例如某類型有 m
個方法,某介面有 n
個方法,則很容易知道這種判定的時間複雜度為 O(mn)
,Go 會對方法集的函數按照函數名的字典序進行排序,所以實際的時間複雜度為 O(m+n)
。
這裡我們來探索將一個介面轉換給另外一個介面背後的原理,當然,能轉換的原因必然是類型相容。
直接來看一個例子:
package main
import "fmt"
type coder interface {
code()
run()
}
type runner interface {
run()
}
type Gopher struct {
language string
}
func (g Gopher) code() {
return
}
func (g Gopher) run() {
return
}
func main() {
var c coder = Gopher{}
var r runner
r = c
fmt.Println(c, r)
}
簡單解釋下上述代碼:定義了兩個 interface
: coder
和 runner
。定義了一個實體類型 Gopher
,類型 Gopher
實現了兩個方法,分別是 run()
和 code()
。main 函數里定義了一個介面變數 c
,綁定了一個 Gopher
對象,之後將 c
賦值給另外一個介面變數 r
。賦值成功的原因是 c
中包含 run()
方法。這樣,兩個介面變數完成了轉換。
執行命令:
go tool compile -S ./src/main.go
得到 main 函數的彙編命令,可以看到: r = c
這一行語句實際上是調用了 runtime.convI2I(SB)
,也就是 convI2I
函數,從函數名來看,就是將一個 interface
轉換成另外一個 interface
,看下它的源代碼:
func convI2I(inter *interfacetype, i iface) (r iface) {
tab := i.tab
if tab == nil {
return
}
if tab.inter == inter {
r.tab = tab
r.data = i.data
return
}
r.tab = getitab(inter, tab._type, false)
r.data = i.data
return
}
代碼比較簡單,函數參數 inter
表示介面類型,i
表示綁定了實體類型的介面,r
則表示介面轉換了之後的新的 iface
。通過前面的分析,我們又知道, iface
是由 tab
和 data
兩個欄位組成。所以,實際上 convI2I
函數真正要做的事,找到新 interface
的 tab
和 data
,就大功告成了。
我們還知道,tab
是由介面類型 interfacetype
和 實體類型 _type
。所以最關鍵的語句是 r.tab = getitab(inter, tab._type, false)
。
因此,重點來看下 getitab
函數的源碼,只看關鍵的地方:
func getitab(inter *interfacetype, typ *_type, canfail bool) *itab {
// ……
// 根據 inter, typ 計算出 hash 值
h := itabhash(inter, typ)
// look twice - once without lock, once with.
// common case will be no lock contention.
var m *itab
var locked int
for locked = 0; locked < 2; locked++ {
if locked != 0 {
lock(&ifaceLock)
}
// 遍歷哈希表的一個 slot
for m = (*itab)(atomic.Loadp(unsafe.Pointer(&hash[h]))); m != nil; m = m.link {
// 如果在 hash 表中已經找到了 itab(inter 和 typ 指針都相同)
if m.inter == inter && m._type == typ {
// ……
if locked != 0 {
unlock(&ifaceLock)
}
return m
}
}
}
// 在 hash 表中沒有找到 itab,那麼新生成一個 itab
m = (*itab)(persistentalloc(unsafe.Sizeof(itab{})+uintptr(len(inter.mhdr)-1)*sys.PtrSize, 0, &memstats.other_sys))
m.inter = inter
m._type = typ
// 添加到全局的 hash 表中
additab(m, true, canfail)
unlock(&ifaceLock)
if m.bad {
return nil
}
return m
}
簡單總結一下:getitab 函數會根據 interfacetype
和 _type
去全局的 itab 哈希表中查找,如果能找到,則直接返回;否則,會根據給定的 interfacetype
和 _type
新生成一個 itab
,並插入到 itab 哈希表,這樣下一次就可以直接拿到 itab
。
這裡查找了兩次,並且第二次上鎖了,這是因為如果第一次沒找到,在第二次仍然沒有找到相應的 itab
的情況下,需要新生成一個,並且寫入哈希表,因此需要加鎖。這樣,其他協程在查找相同的 itab
並且也沒有找到時,第二次查找時,會被掛住,之後,就會查到第一個協程寫入哈希表的 itab
。
再來看一下 additab
函數的代碼:
// 檢查 _type 是否符合 interface_type 並且創建對應的 itab 結構體 將其放到 hash 表中
func additab(m *itab, locked, canfail bool) {
inter := m.inter
typ := m._type
x := typ.uncommon()
// both inter and typ have method sorted by name,
// and interface names are unique,
// so can iterate over both in lock step;
// the loop is O(ni+nt) not O(ni*nt).
//
// inter 和 typ 的方法都按方法名稱進行了排序
// 並且方法名都是唯一的。所以迴圈的次數是固定的
// 只用迴圈 O(ni+nt),而非 O(ni*nt)
ni := len(inter.mhdr)
nt := int(x.mcount)
xmhdr := (*[1 << 16]method)(add(unsafe.Pointer(x), uintptr(x.moff)))[:nt:nt]
j := 0
for k := 0; k < ni; k++ {
i := &inter.mhdr[k]
itype := inter.typ.typeOff(i.ityp)
name := inter.typ.nameOff(i.name)
iname := name.name()
ipkg := name.pkgPath()
if ipkg == "" {
ipkg = inter.pkgpath.name()
}
for ; j < nt; j++ {
t := &xmhdr[j]
tname := typ.nameOff(t.name)
// 檢查方法名字是否一致
if typ.typeOff(t.mtyp) == itype && tname.name() == iname {
pkgPath := tname.pkgPath()
if pkgPath == "" {
pkgPath = typ.nameOff(x.pkgpath).name()
}
if tname.isExported() || pkgPath == ipkg {
if m != nil {
// 獲取函數地址,並加入到itab.fun數組中
ifn := typ.textOff(t.ifn)
*(*unsafe.Pointer)(add(unsafe.Pointer(&m.fun[0]), uintptr(k)*sys.PtrSize)) = ifn
}
goto nextimethod
}
}
}
// ……
m.bad = true
break
nextimethod:
}
if !locked {
throw("invalid itab locking")
}
// 計算 hash 值
h := itabhash(inter, typ)
// 加到Hash Slot鏈表中
m.link = hash[h]
m.inhash = true
atomicstorep(unsafe.Pointer(&hash[h]), unsafe.Pointer(m))
}
additab
會檢查 itab
持有的 interfacetype
和 _type
是否符合,就是看 _type
是否完全實現了 interfacetype
的方法,也就是看兩者的方法列表重疊的部分就是 interfacetype
所持有的方法列表。註意到其中有一個雙層迴圈,乍一看,迴圈次數是 ni * nt
,但由於兩者的函數列表都按照函數名稱進行了排序,因此最終只執行了 ni + nt
次,代碼里通過一個小技巧來實現:第二層迴圈並沒有從 0 開始計數,而是從上一次遍歷到的位置開始。
求 hash 值的函數比較簡單:
func itabhash(inter *interfacetype, typ *_type) uint32 {
h := inter.typ.hash
h += 17 * typ.hash
return h % hashSize
}
hashSize
的值是 1009。
更一般的,當把實體類型賦值給介面的時候,會調用 conv
系列函數,例如空介面調用 convT2E
系列、非空介面調用 convT2I
系列。這些函數比較相似:
- 具體類型轉空介面時,_type 欄位直接複製源類型的 _type;調用 mallocgc 獲得一塊新記憶體,把值複製進去,data 再指向這塊新記憶體。
- 具體類型轉非空介面時,入參 tab 是編譯器在編譯階段預先生成好的,新介面 tab 欄位直接指向入參 tab 指向的 itab;調用 mallocgc 獲得一塊新記憶體,把值複製進去,data 再指向這塊新記憶體。
- 而對於介面轉介面,itab 調用 getitab 函數獲取。只用生成一次,之後直接從 hash 表中獲取。
9. 如何用 interface 實現多態
Go
語言並沒有設計諸如虛函數、純虛函數、繼承、多重繼承等概念,但它通過介面卻非常優雅地支持了面向對象的特性。
多態是一種運行期的行為,它有以下幾個特點:
- 一種類型具有多種類型的能力
- 允許不同的對象對同一消息做出靈活的反應
- 以一種通用的方式對待個使用的對象
- 非動態語言必須通過繼承和介面的方式來實現
看一個實現了多態的代碼例子:
package main
import "fmt"
func main() {
qcrao := Student{age: 18}
whatJob(&qcrao)
growUp(&qcrao)
fmt.Println(qcrao)
stefno := Programmer{age: 100}
whatJob(stefno)
growUp(stefno)
fmt.Println(stefno)
}
func whatJob(p Person) {
p.job()
}
func growUp(p Person) {
p.growUp()
}
type Person interface {
job()
growUp()
}
type Student struct {
age int
}
func (p Student) job() {
fmt.Println("I am a student.")
return
}
func (p *Student) growUp() {
p.age += 1
return
}
type Programmer struct {
age int
}
func (p Programmer) job() {
fmt.Println("I am a programmer.")
return
}
func (p Programmer) growUp() {
// 程式員老得太快 ^_^
p.age += 10
return
}
代碼里先定義了 1 個 Person
介面,包含兩個函數:
job()
growUp()
然後,又定義了 2 個結構體,Student
和 Programmer
,同時,類型 *Student
、Programmer
實現了 Person
介面定義的兩個函數。註意,*Student
類型實現了介面, Student
類型卻沒有。
之後,我又定義了函數參數是 Person
介面的兩個函數:
func whatJob(p Person)
func growUp(p Person)
main
函數里先生成 Student
和 Programmer
的對象,再將它們分別傳入到函數 whatJob
和 growUp
。函數中,直接調用介面函數,實際執行的時候是看最終傳入的實體類型是什麼,調用的是實體類型實現的函數。於是,不同對象針對同一消息就有多種表現,多態
就實現了。
更深入一點來說的話,在函數 whatJob()
或者 growUp()
內部,介面 person
綁定了實體類型 *Student
或者 Programmer
。根據前面分析的 iface
源碼,這裡會直接調用 fun
里保存的函數,類似於: s.tab->fun[0]
,而因為 fun
數組裡保存的是實體類型實現的函數,所以當函數傳入不同的實體類型時,調用的實際上是不同的函數實現,從而實現多態。
運行一下代碼:
I am a student.
{19}
I am a programmer.
{100}
10. Go 介面與 C++ 介面有何異同
介面定義了一種規範,描述了類的行為和功能,而不做具體實現。
C++ 的介面是使用抽象類來實現的,如果類中至少有一個函數被聲明為純虛函數,則這個類就是抽象類。純虛函數是通過在聲明中使用 "= 0" 來指定的。例如:
class Shape
{
public:
// 純虛函數
virtual double getArea() = 0;
private:
string name; // 名稱
};
設計抽象類的目的,是為了給其他類提供一個可以繼承的適當的基類。抽象類不能被用於實例化對象,它只能作為介面使用。
派生類需要明確地聲明它繼承自基類,並且需要實現基類中所有的純虛函數。
C++ 定義介面的方式稱為“侵入式”,而 Go 採用的是 “非侵入式”,不需要顯式聲明,只需要實現介面定義的函數,編譯器自動會識別。
C++ 和 Go 在定義介面方式上的不同,也導致了底層實現上的不同。C++ 通過虛函數表來實現基類調用派生類的函數;而 Go 通過 itab
中的 fun
欄位來實現介面變數調用實體類型的函數。C++ 中的虛函數表是在編譯期生成的;而 Go 的 itab
中的 fun
欄位是在運行期間動態生成的。原因在於,Go 中實體類型可能會無意中實現 N 多介面,很多介面並不是本來需要的,所以不能為類型實現的所有介面都生成一個 itab
, 這也是“非侵入式”帶來的影響;這在 C++ 中是不存在的,因為派生需要顯示聲明它繼承自哪個基類。
參考資料
【包含反射、介面等源碼分析】https://zhuanlan.zhihu.com/p/27055513
【虛函數表和C++的區別】https://mp.weixin.qq.com/s/jU9HeR1tOyh-ME5iEYM5-Q
【具體類型向介面賦值】https://tiancaiamao.gitbooks.io/go-internals/content/zh/07.2.html
【值類型和指針類型,iface源碼】https://www.jianshu.com/p/5f8ecbe4f6af
【總體說明itab的生成方式、作用】http://www.codeceo.com/article/go-interface.html
【conv系列函數的作用】https://blog.csdn.net/zhonglinzhang/article/details/85772336
【convI2I itab作用】https://www.jianshu.com/p/a5e99b1d50b1
【interface 源碼解讀 很不錯 包含反射】http://wudaijun.com/2018/01/go-interface-implement/
【what why how思路來寫interface】http://legendtkl.com/2017/06/12/understanding-golang-interface/
【有彙編分析,不錯】http://legendtkl.com/2017/07/01/golang-interface-implement/
【第一幅圖可以參考 gdb調試】https://www.do1618.com/archives/797/golang-interface%E5%88%86%E6%9E%90/
【類型轉換和斷言】https://my.oschina.net/goal/blog/194308
【interface 和 nil】https://my.oschina.net/goal/blog/194233
【函數和方法】https://www.jianshu.com/p/5376e15966b3
【反射】https://flycode.co/archives/267357
【介面特點列表】https://segmentfault.com/a/1190000011451232
【interface 全面介紹,包含C++對比】https://www.jianshu.com/p/b38b1719636e
【Go四十二章經 interface】https://github.com/ffhelicopter/Go42/blob/master/content/42_19_interface.md
【對Go介面的反駁,有說到介面的定義】http://blog.zhaojie.me/2013/04/why-i-dont-like-go-style-interface-or-structural-typing.html
【gopher 介面】http://fuxiaohei.me/2017/4/22/gopherchina-2017.html
【譯文 還不錯】https://mp.weixin.qq.com/s/tBg8D1qXHqBr3r7oRt6iGA
【infoQ 文章】https://www.infoq.cn/article/go-interface-talk
【Go介面詳解】https://zhuanlan.zhihu.com/p/27055513
【Go interface】https://sanyuesha.com/2017/07/22/how-to-understand-go-interface/
【getitab源碼說明】https://www.twblogs.net/a/5c245d59bd9eee16b3db561d
【淺顯易懂】https://yami.io/golang-interface/
【golang io包的妙用】https://www.jianshu.com/p/8c33f7c84509
【探索C++與Go的介面底層實現】https://www.jianshu.com/p/073c09a05da7
https://github.com/teh-cmc/go-internals/blob/master/chapter2_interfaces/README.md
【彙編層面】http://xargin.com/go-and-interface/
【有圖】https://i6448038.github.io/2018/10/01/Golang-interface/
【圖】https://mp.weixin.qq.com/s/px9BRQrTCLX6BbvXJbysCA
【英文開源書】https://github.com/cch123/go-internals/blob/master/chapter2_interfaces/README.md
【曹大的翻譯】http://xargin.com/go-and-interface/