[toc] 處理器不能直接解釋程式集。程式集用的是另一種語言,即公共中間語言(Common Intermediate Language,CIL),或稱為中間語言(IL)[^1]。 [^1]: CIL 的第三種說法是 Microsoft IL(MSIL)。 本博客使用 CIL 一詞,因其是 CLI 標 ...
目錄
處理器不能直接解釋程式集。程式集用的是另一種語言,即公共中間語言(Common Intermediate Language,CIL),或稱為中間語言(IL)1。
C# 編譯器將 C# 源代碼文件轉換成中間語言。為了將 CIL 代碼轉換成處理器能理解的機器碼,還要完成一個額外的步驟(通常在運行時進行)。該步驟涉及 C# 程式執行的一個重要元素:VES(Virtual Execution System,虛擬執行系統)。VES 也稱為運行時(runtime)。
它根據需要編譯 CIL 代碼,這個過程稱為即時編譯或 JIT 編譯(just-in-time compilation)。如代碼在像“運行時”這樣的一個“代理” 的上下文中執行,就稱為托管代碼(managed code),在“運行時”的控制下執行的過程則稱為托管執行(managed execution)。
之所以 稱為“托管”,是因為“運行時”管理著諸如記憶體分配、安全性和 JIT 編譯等方面,從而控制了主要的程式行為。執行時不需要“運行時”的代碼稱為本機代碼(native code)或非托管代碼(unmanaged code)。
說明:“運行時”既可能指“程式執行的時候”,也可能指“虛擬執行系統”。為明確起見,用“執行時”表示“程式執行的時候”,用“運行時”表示負責管理 C# 程式執行的代理。2
“運行時”規範包含在一個包容面更廣的規範中,即 CLI(Common Language Infrastructure,公共語言基礎結構)規範。作為國際標準,CLI 包含了以下幾方面的規範:
- VES 或“運行時”。
- CIL。
- 支持語言互操作性的類型系統,稱為 CTS(Common Type System,公共類型系統)。
- 如何編寫通過 CLI 相容語言訪問的庫的指導原則,這部分內容具體放在公共語言規範(Common Language Specification,CLS)中。
- 使各種服務能被 CLI 識別的元數據(包括程式集的佈局或文件格式規範)。
在“運行時”執行引擎的上下文中運行,程式員不需要直接寫代碼就能使用幾種服務和功能,包括:
- 語言互操作性:不同源語言間的互操作性。語言編譯器將每種源語言轉換成相同中間語言(CIL)來實現這種互操作性。
- 類型安全:檢查類型間轉換,確保相容的類型才能相互轉換。這有助於防範緩衝區溢出(這是產生安全隱患的主要原因)。
- 代碼訪問安全性:程式集開發者的代碼有權在電腦上執行的證明。
- 垃圾回收:一種記憶體管理機制,自動釋放“運行時”為數據分配的空間。
- 平臺可移植性:同一程式集可在多種操作系統上運行。要實現這一點,一個顯而易見的限制就是不能使用平臺特有的庫。所以平臺依賴問題需單獨解決。
- BCL(基類庫):提供開發者能(在所有 .NET 框架中)依賴的大型代碼庫,使其不必親自寫這些代碼。
註意: 本篇只是簡單介紹了 CLI,目的是讓讀者熟悉 C# 程式的執行環境。此外,本篇還提及了本系列博文後面才會用到的一些術語。在時機合適的時候,我會專門總結 CLI 及其與 C# 的關係。
CIL 和 ILDASM
前面說過,C# 編譯器將 C# 代碼轉換成 CIL 代碼而不是機器碼。處理器只理解機器碼,所以 CIL 代碼必須先轉換成機器碼才能由處理器執行。可用 CIL 反彙編程式將程式集解構為 CIL。通常使用 Microsoft 特有的文件名 ILDASM 來稱呼這種 CIL 反彙編程式(ILDASM 是 IL Disassembler 的簡稱),它能對程式集執行反彙編,提取 C# 編譯器生成的CIL。
反彙編 .NET 程式集的結果比機器碼更易理解。許多開發人員害怕即使別人沒有拿到源代碼,程式也容易被反彙編並曝光其演算法。其實無論是否基於 CLI,任何程式防止反編譯唯一安全的方法就是禁止訪問編譯好的程式(例如只在網站上存放程式,不把它分發到用戶機器)。
但假如目的只是減小別人獲得源代碼的可能性,可考慮使用一些混淆器(obfuscator)產品。這種產品會打開 IL 代碼,轉換成一種功能不變但更難理解的形式。這可以防止普通開發者訪問代碼,使程式集難以被反編譯成容易理解的代碼。除非程式需要對演算法進行高級安全防護,否則混淆器足矣。
查看 myApp.dll 的 CIL 輸出
myApp.dll 程式請參考這篇文章:https://www.vinanysoft.com/c-sharp-basics/introducing/start-with-hello-world/
安裝了 Visual Studio 之後 ILDASM 會預設被安裝,位置是:C:\Program Files (x86)\Microsoft SDKs\Windows\v10.0A(隨便一個目錄)\bin\NETFX 4.8 Tools(隨便一個目錄)\x64
。
雙擊運行 ildasm.exe,把 myApp.dll 拖進去,如下圖:
雙擊即可查看到 IL 代碼,下麵是 MANIFEST 的 IL 代碼
// Metadata version: v4.0.30319
.assembly extern System.Runtime
{
.publickeytoken = (B0 3F 5F 7F 11 D5 0A 3A ) // .?_....:
.ver 4:2:1:0
}
.assembly extern System.Console
{
.publickeytoken = (B0 3F 5F 7F 11 D5 0A 3A ) // .?_....:
.ver 4:1:1:0
}
.assembly myApp
{
.custom instance void [System.Runtime]System.Runtime.CompilerServices.CompilationRelaxationsAttribute::.ctor(int32) = ( 01 00 08 00 00 00 00 00 )
.custom instance void [System.Runtime]System.Runtime.CompilerServices.RuntimeCompatibilityAttribute::.ctor() = ( 01 00 01 00 54 02 16 57 72 61 70 4E 6F 6E 45 78 // ....T..WrapNonEx
63 65 70 74 69 6F 6E 54 68 72 6F 77 73 01 ) // ceptionThrows.
// --- 下列自定義特性會自動添加,不要取消註釋 -------
// .custom instance void [System.Runtime]System.Diagnostics.DebuggableAttribute::.ctor(valuetype [System.Runtime]System.Diagnostics.DebuggableAttribute/DebuggingModes) = ( 01 00 07 01 00 00 00 00 )
.custom instance void [System.Runtime]System.Runtime.Versioning.TargetFrameworkAttribute::.ctor(string) = ( 01 00 18 2E 4E 45 54 43 6F 72 65 41 70 70 2C 56 // ....NETCoreApp,V
65 72 73 69 6F 6E 3D 76 33 2E 30 01 00 54 0E 14 // ersion=v3.0..T..
46 72 61 6D 65 77 6F 72 6B 44 69 73 70 6C 61 79 // FrameworkDisplay
4E 61 6D 65 00 ) // Name.
.custom instance void [System.Runtime]System.Reflection.AssemblyCompanyAttribute::.ctor(string) = ( 01 00 05 6D 79 41 70 70 00 00 ) // ...myApp..
.custom instance void [System.Runtime]System.Reflection.AssemblyConfigurationAttribute::.ctor(string) = ( 01 00 05 44 65 62 75 67 00 00 ) // ...Debug..
.custom instance void [System.Runtime]System.Reflection.AssemblyFileVersionAttribute::.ctor(string) = ( 01 00 07 31 2E 30 2E 30 2E 30 00 00 ) // ...1.0.0.0..
.custom instance void [System.Runtime]System.Reflection.AssemblyInformationalVersionAttribute::.ctor(string) = ( 01 00 05 31 2E 30 2E 30 00 00 ) // ...1.0.0..
.custom instance void [System.Runtime]System.Reflection.AssemblyProductAttribute::.ctor(string) = ( 01 00 05 6D 79 41 70 70 00 00 ) // ...myApp..
.custom instance void [System.Runtime]System.Reflection.AssemblyTitleAttribute::.ctor(string) = ( 01 00 05 6D 79 41 70 70 00 00 ) // ...myApp..
.hash algorithm 0x00008004
.ver 1:0:0:0
}
.module myApp.dll
// MVID: {29FC93A2-9A52-445C-A581-09AA5BCC11C7}
.imagebase 0x00400000
.file alignment 0x00000200
.stackreserve 0x00100000
.subsystem 0x0003 // WINDOWS_CUI
.corflags 0x00000001 // ILONLY
// Image base: 0x000002015D090000
.class private auto ansi beforefieldint
.class private auto ansi beforefieldinit myApp.Program
extends [System.Runtime]System.Object
{
} // end of class myApp.Program
.ctor:void()
.method public hidebysig specialname rtspecialname
instance void .ctor() cil managed
{
// 代碼大小 8 (0x8)
.maxstack 8
IL_0000: ldarg.0
IL_0001: call instance void [System.Runtime]System.Object::.ctor()
IL_0006: nop
IL_0007: ret
} // end of method Program::.ctor
Main:void(string[])
.method private hidebysig static void Main(string[] args) cil managed
{
.entrypoint
// 代碼大小 42 (0x2a)
.maxstack 2
.locals init (valuetype [System.Runtime]System.DateTime V_0)
IL_0000: nop
IL_0001: ldstr "Hello World!"
IL_0006: call void [System.Console]System.Console::WriteLine(string)
IL_000b: nop
IL_000c: ldstr "The current time is "
IL_0011: call valuetype [System.Runtime]System.DateTime [System.Runtime]System.DateTime::get_Now()
IL_0016: stloc.0
IL_0017: ldloca.s V_0
IL_0019: call instance string [System.Runtime]System.DateTime::ToString()
IL_001e: call string [System.Runtime]System.String::Concat(string,
string)
IL_0023: call void [System.Console]System.Console::WriteLine(string)
IL_0028: nop
IL_0029: ret
} // end of method Program::Main
最開頭是清單(manifest)信息。其中不僅包括被反編譯的模塊的全名(myApp),還包括它依賴的所有模塊和程式集及其版本信息。
基於這樣的一個 CIL 代碼清單,最有趣的可能就是能相對比較容易地理解程式所做的事情,這比閱讀並理解機器碼(彙編程式)容易多了。
上述代碼出現了對 System.Console.WriteLine()
的顯式引用。 CIL 代碼清單包含許多外圍信息,但如果開發者想要理解 C# 模塊(或任何基於 CLI 的程式)的內部工作原理,但又拿不到源代碼,只要作者沒有使用混淆器,理解這樣的 CIL 代碼清單還是比較容易的。
事實上,一些免費工具(比如 Red Gate Reflector,ILSpy,JustDecompile,dotPeek 和 CodeReflect)都能將 CIL 自動反編譯成 C#。
使用 ILSpy 查看 myApp.dll 反編譯後的代碼
ILSpy 的地址:https://github.com/icsharpcode/ILSpy
雙擊運行 ILSpy.exe,把 myApp.dll 拖進去,如下圖:
註意: 反彙編(disassemble)和反編譯(decompile)的區別。反彙編得到的是彙編代碼,反編譯得到的是所用語言的源代碼。