[TOC] 前言 本文主要是以 C 為例介紹 .NET 中的三種指針類型(本文不包含對於函數指針的介紹): 對象引用 、 非托管指針 、 托管指針 。 學習是一個不斷深化理解的過程,藉此博客,把自己關於 .NET 中指針相關的理解和大家一起討論一下,若有表述不清楚,理解不正確之處,還請大家批評指正。 ...
目錄
前言
本文主要是以 C# 為例介紹 .NET 中的三種指針類型(本文不包含對於函數指針的介紹):對象引用、非托管指針 、托管指針。
學習是一個不斷深化理解的過程,藉此博客,把自己關於 .NET 中指針相關的理解和大家一起討論一下,若有表述不清楚,理解不正確之處,還請大家批評指正。
開始話題之前,我們不妨先對一些概念作出定義。
變數:給存儲單元指定名稱、即定義記憶體單元的名稱或者說是標識。
指針:一種特殊的變數、其存儲的是值的地址而不是值本身。
一、對象引用
對於對象引用,大家都不會陌生。
與值類型變數直接包含值不同,引用類型變數存儲的是數據的存儲位置(托管堆記憶體地址)。
對象引用是在托管堆上分配的對象的開始位置指針。訪問數據時,運行時要先從變數中讀取記憶體位置(隱式間接定址),再跳轉到包含數據的記憶體位置,這一切都是隱藏在CLR背後發生的事情,我們在使用引用類型的時候,並不需要關心其背後的實現。
二、值傳遞和引用傳遞
很多朋友,包括我,在初期學習的時候,可能都會有這麼一個認知誤區:"對象在C#中是按引用傳遞的"。
對於引用傳遞,借鑒《深入理解C#》中話,我們需要記住這一點:
假如以引用傳遞的方式來傳送一個變數,那麼調用的方法可以通過更改其參數值,來改變調用者的變數值。
例如下麵這麼一個例子:
static void Main(string[] args)
{
Foo foo = new Foo
{
Name = "A"
};
Test(foo);
Console.WriteLine(foo.Name); // 輸出B
}
static void Test(Foo obj)
{
obj.Name = "B";
obj = new Foo
{
Name = "C"
};
}
按照引用傳遞的定義,上述代碼的結果應該是 C,但實際輸出的是 B。
因為 C# 預設是按值傳遞的,在將Main函數中的 foo 變數傳入Test函數時,會將它所包含的值(對象引用)複製給變數obj。所以可以通過obj變數修改原來的實例成員,這僅僅是由於引用類型的特性導致的,並不是所謂的引用傳遞。因為如果將obj變數指向一個新的實例,並不會影響到foo變數,它們兩者是完全獨立的。
只要對上述代碼做一個小修改,就能順利地列印出 C,也就是通過大家習慣的 ref 關鍵詞。
static void Main(string[] args)
{
Foo foo = new Foo
{
Name = "A"
};
Test(ref foo);
Console.WriteLine(foo.Name); // 輸出C
}
static void Test(ref Foo obj)
{
obj.Name = "B";
obj = new Foo
{
Name = "C"
};
}
三、初識托管指針和非托管指針
在C#中,如果我們想要定義一個引用傳遞的方法,我們需要通過給方法參數加上 ref 或者 out 關鍵詞。
同時C#也允許我們通過 unsafe 關鍵詞編寫不安全的代碼。那麼這兩者到底有什麼區別呢。
以以下C#代碼為例:
static unsafe void Main(string[] args)
{
int a, b;
Method1(&a); // 使用非托管指針
Method2(out b); // 使用out關鍵詞
Console.WriteLine($"a:{a},b:{b}"); // a:1,b:2
}
static unsafe void Method1(int* num)
{
*num = 1;
}
static void Method2(out int b)
{
b = 2;
}
接下來,我們通過查看生成的IL的代碼來分析一下這兩者之間的區別。
.assembly extern mscorlib {}
.assembly 'App' {}
.class private auto ansi beforefieldinit
PointerDemo.Program
extends [mscorlib]System.Object
{
.method private hidebysig static void
Main(
string[] args
) cil managed
{
.entrypoint
.maxstack 3
.locals init (
[0] int32 a,
[1] int32 b
)
// [8 9 - 8 10]
IL_0000: nop
// [10 13 - 10 25]
IL_0001: ldloca.s a
IL_0003: conv.u
IL_0004: call void PointerDemo.Program::Method1(int32*)
IL_0009: nop
// [11 13 - 11 28]
IL_000a: ldloca.s b
IL_000c: call void PointerDemo.Program::Method2(int32&)
IL_0011: nop
// [13 13 - 13 47]
IL_0012: ldstr "a:{0},b:{1}"
IL_0017: ldloc.0 // a
IL_0018: box [mscorlib]System.Int32
IL_001d: ldloc.1 // b
IL_001e: box [mscorlib]System.Int32
IL_0023: call string [mscorlib]System.String::Format(string, object, object)
IL_0028: call void [mscorlib]System.Console::WriteLine(string)
IL_002d: nop
// [14 9 - 14 10]
IL_002e: ret
} // end of method Program::Main
.method private hidebysig static void
Method1(
int32* num
) cil managed
{
.maxstack 8
// [17 9 - 17 10]
IL_0000: nop
// [18 13 - 18 22]
IL_0001: ldarg.0 // num
IL_0002: ldc.i4.1
IL_0003: stind.i4
// [19 9 - 19 10]
IL_0004: ret
} // end of method Program::Method1
.method private hidebysig static void
Method2(
[out] int32& b
) cil managed
{
.maxstack 8
// [22 9 - 22 10]
IL_0000: nop
// [23 13 - 23 19]
IL_0001: ldarg.0 // b
IL_0002: ldc.i4.2
IL_0003: stind.i4
// [24 9 - 24 10]
IL_0004: ret
} // end of method Program::Method2
.method public hidebysig specialname rtspecialname instance void
.ctor() cil managed
{
.maxstack 8
IL_0000: ldarg.0 // this
IL_0001: call instance void [mscorlib]System.Object::.ctor()
IL_0006: nop
IL_0007: ret
} // end of method Program::.ctor
} // end of class PointerDemo.Program
可以看到
靜態方法Method1中的參數對應的IL代碼 int32* num。
靜態方法Method2中的參數對應的IL代碼是 [out] int32& b,其中[out]即使去除也不影響代碼的運行,上述代碼是可通過ilasm編譯的完整代碼,有興趣的朋友可以自己做嘗試。
通過學習《.NET探秘:MSIL權威指南》這本書,我們可以瞭解到很多相關的知識。
在CLR中可以定義兩種類型的指針:
ILAsm符號 | 說明 |
---|---|
type* | 指向type的非托管指針 |
type& | 指向type的托管指針 |
也就是說用out/ref定義的指針類型其實對應的就是CLR中的托管指針。
四、非托管指針
非托管指針的使用主要包括
定址運算符 &
間接定址運算符 *
用於結構指針的成員訪問運算符 ->
非托管指針的用法和C/C++基本一致,這邊不一一列出,下麵主要列出幾個.net 中非托管指針的註意點。
1、非托管指針不能指向對象引用
我們知道一個引用類型的變數,它所存儲的是托管堆上的實例的記憶體地址。這個記憶體地址記錄本身也是保存在記憶體的某個位置。類似於我們用記事本記下了某人的聯繫方式,同時這條聯繫方式記錄本身也占據了我們記事本上一定的空間,被我們寫在了記事本的某個位置。
我們可以創建指向值類型變數的非托管指針,也可以創建多級非托管指針,但是不能創建指向引用類型變數(對象引用)的非托管指針。
static unsafe void Main(string[] args)
{
int num = 2;
object obj = new object();
int* pNum = # // 指向值類型變數的非托管指針,編譯通過
int** ppNum = &pNum; // 二級指針,編譯通過
object* pObj = &obj; // 指向引用類型變數的非托管指針,編譯不通過
}
2、類成員指針
如果我們想要創建一個對象的值類型成員變數的指針,按下方的代碼是無法編譯通過的。
class Foo
{
public int Bar;
}
static unsafe void Main(string[] args)
{
Foo foo = new Foo();
int* p = &foo.Bar; // 編譯不通過
}
因為對於生存在托管堆上的引用類型的實例而言,在一次 GC 之後,其記憶體位置可能會發生變動(GC的compact階段),包含在實例內的成員變數也就隨之發生了位置的移動。對於標識記憶體位置的指針而言,顯然這樣的情況是不能夠被允許的。
但是我們可以通過 fixed 關鍵詞避免 GC 時實例記憶體位置的移動來實現這種類型的指針的創建,如下麵代碼所示。
static unsafe void Main(string[] args)
{
Foo foo = new Foo();
fixed (int* p = &foo.Bar) // 編譯通過
{
Console.WriteLine((int)p); // 列印記憶體地址
Console.WriteLine(*p); // 列印值
}
}
同理,我們也可以利用 fixed 關鍵詞創建指向值類型數組的指針(數組是引用類型,這裡指數組的元素是值類型)。
static unsafe void Main(string[] args)
{
int[] arr = { 1, 2 };
// 除去 fixed 關鍵詞外,指向數組的非托管指針聲明方式與 C/C++ 類似
fixed (int* p = arr)
{
// 指針保存的是第一個元素的記憶體地址
Console.WriteLine(*p); // 輸出1
// 通過 +1 可以獲取到第二個元素的記憶體地址
Console.WriteLine(*(p + 1)); // 輸出2
}
}
五、托管指針
在上文我們已經提到,我們在使用引用傳遞的時候使用的 ref/out 關鍵詞其實就是創建了托管指針。
在 C#7 之前,我們只能在方法參數上見到托管指針的身影,C#7 進一步開放了托管指針的功能,使得我們能夠在更多的場景下使用它們。例如和非托管指針一樣,用於方法的返回值,
托管指針完全受 CLR 管理,與非托管指針相比,在 C# 中(IL對於托管指針的限制會更少)托管指針存在以下幾個特點:
- 只能引用已經存在的項,例如欄位、局部變數或者方法參數,並不支持和非托管指針一樣的單獨聲明。
- 不支持多級托管指針,但是托管指針能夠指向對象引用。
- 不能夠列印記憶體地址的值。
- 不能夠執行指針演算法。
- 不需要顯示的間接定址(生成的IL代碼中執行了間接定址 通過 ldind.i4、ldind.ref 等指令 )。
static void Main(string[] args)
{
var foo = new Foo{Bar = 1};
// 創建指向引用類型變數(對象引用)的托管指針
ref Foo p = ref foo;
// IL代碼中通過 ldind.ref 指令間接定址找到對象引用
Console.WriteLine(p.Bar); // 輸出1
}