在 C 中 Object 是所有類的基類,所有的結構和類都直接或間接的派生自它。前面這段話可以說所有的 C 開發人員都知道,但是我相信其中有一部分程式員並不清楚甚至不知道我們常用的 ToString 、 Equals 和 GetHashCode 虛方法都來自於 Object 類,並且我們可以對它們進 ...
在 C# 中 Object 是所有類的基類,所有的結構和類都直接或間接的派生自它。前面這段話可以說所有的 C# 開發人員都知道,但是我相信其中有一部分程式員並不清楚甚至不知道我們常用的 ToString 、 Equals 和 GetHashCode 虛方法都來自於 Object 類,並且我們可以對它們進行重寫。重寫這三個虛方法可以說在項目開發中經常用到,只不過大部分開發人員並未留意這三個虛方法可以重寫,而是自己寫方法來實現。
下麵我就來具體講解一下它們三個應該怎麼重寫。在這裡我需要說明的是本篇文章會大量涉及到設計規範和設計要求,代碼只是作為輔助理解的形式出現,因此文章中的所有代碼將會以代碼段的形式出現。
零、 ToString
ToString 重寫是這三種方法中重寫最簡單的,也是最常用的。但是有一部分開發人員認為重寫 ToString 方法意義不大,那麼我在這裡要說的是這種想法是錯誤的。當我們在對象上調用 ToString 時預設返回的是類的完全限定名稱,比如說我們在 System.IO.File 對象上調用這個方法,就會返回字元串 System.IO.File ,這個結果往往並不是我們所需要的結果並且這個結果也沒有什麼意義。例如我們在一個 User 類中重寫 ToString 方法,每次調用 User.ToString() 時返回 "XXX今年XX歲",如果我們不重寫 ToString 方法的話就得不到我們想要的結果。因此我們必須重寫,這時我們就可以這麼寫。
public class User
{
public int Id {get;set;}
public string Name {get;set;}
public int Age {get;set;}
public string Sex {get;set;}
public override string ToString()
{
return $"{Name}今年{Age}歲!";
}
}
重寫之後我們就可以得到我們想要的輸出內容了。雖然重寫 ToString 可以得到我們想要的內容,但是我們不能在任何情況下都重寫 ToString, 只有在以下三種情況下方可重寫 ToString :
- 代碼面對的最終用戶是開發人員;
- 需要寫入日誌;
- IDE調試輸出。
在上面三種情況下重寫 ToString 我們還需要遵循一些設計規範,這些設計規範並不是微軟所定義的,而是開發人員在開發過程中總結出來的:
- ToString 返回的字元串長度應該簡短,內容描述應該清晰;
- 不要從 ToString 方法中返回 “”,而要返回 null ;
- 不要再 ToString 方法中引發並拋出異常,針對異常應該及時捕獲並處理;
- 如果返回值存在地域文化(比如語言)或存在格式化要求,那麼就必須重寫 ToString 方法;
- ToString 重寫後必須返回獨一無二的字元串來標識實例對象。
到這裡為止我們講解完了 ToString 重寫的方法以及規則。相對來說 ToString 方法重寫是 Object 虛方法重寫中十分簡單的部分,作為開發人員只需按照我前面多說的規則、方法以及實際情況來重寫即可。
一、 Equals 和 ReferenceEquals
在 C# 中如果對兩個對象進行相等判斷,一共有兩種情況分別是:判斷兩者的值相等 或者 判斷兩者的引用地址相同 。一般情況下我們需要對值類型對象判斷值相等,對引用類型對象判斷指向地址相同。Equals 就是用來對引用類型對象判斷指向地址是否相同的。對於重寫 Equals 方法,很多開發人員認為易如反掌,但是在開發中往往忘記一些很重要的細節,這些細節對於程式來說至關重要,下麵我將一一進行詳細講解。
同一和相等
所謂的同一指的是兩個對象如果引用的是同一個實例,那麼我們就說這兩個對象具有同一性。在 C# 中我們可以利用 object 類或者它的派生類中的 ReferenceEquals 靜態方法來判斷對象之間的同一性。但是同一隻是相等的一種,因為在某些情況下兩個對象的部分值或者全部值相等但引用不同,我們也可以說它們具有相等性。下麵我們來看一個例子,這個例子通過重寫相等性來實現兩個對象的相等性。class Program { static void Main(string[] args) { Student s1 = new Student { Age = 12, Id = 1, Name = "小明" }; Student s2 = new Student { Age = 13, Id = 1, Name = "小明" }; if (Student.ReferenceEquals(s1, s2)) { Console.WriteLine("是同一個學生"); } else { Console.WriteLine("不是同一個學生"); } Console.Read(); } } class Student { public int Id { get; set; } public string Name { get; set; } public int Age { get; set; } public static bool ReferenceEquals(Student s1, Student s2) { if (s1.Equals(s2) || object.ReferenceEquals(s1, s2) || s1.Id==s2.Id s1==s2) { return true; } else { return false; } } }
從上述代碼中我們可以看出,雖然 s1 和 s2 引用是不相等的,但是這兩個對象使用了相同的 Id ,因此我們認為 Id 相同的學生就是同一個學生。這麼做可以確保資料庫中不會出現重覆的錄入。
Tip:只有引用類型才會可能出現引用相等的情況,對於值類型來說調用 ReferenceEquals 方法永遠返回的是 false ,因為值類型轉換成 object 時是需要裝箱的,即是傳遞的兩個參數是同一個值,也會返回 false 。
- Equals
判斷兩個對象是否相等,可以使用 Equals ,通過它可以判斷出兩個對象是否具有相同的數據。在 object 中這個方法只是調用了 ReferenceEquals 方法來判斷同一性,因此在必要的時候我們必須重寫 Equals 方法。一般來說重寫 Equals 方法常用的步驟如下:- 檢查對象是否為 null ;
- 判斷是否是引用類型,如果是就判斷引用是否相等;
- 判斷數據類型是否相等;
- 調用具體類型的輔助方法,參數必須是要比較的類型;
- 判斷哈希碼是否相等,這一步需進行短路操作和欄位比較;
- 在基類的 Equals 方法被重寫的前提下,必須檢查基類的 Equals 方法;
- 判斷關鍵欄位的值是否相等;
- 重寫 GetHashCode 方法;
重寫 == 、 != 操作符。
Tip: 如果類型是密封類型,那麼第三步可以省略掉。
- GetHashCode 方法不一定返回的是獨一無二的值,因此我們不能僅僅依賴它的返回值來判斷兩個對象是否相等;
- 我們不能在 GetHashCode 和 Equals 中引發任何異常;
- 必須保證對象之間可以隨意比較,且不能觸發任何異常;
- 必須實現重寫 Equals 、 GetHashCode 、 == 和 != ,且重寫的演算法必須相同;
- 儘量不要在可變類型上重寫相等性操作符。
二、 GetHashCode
在上一小節中我們也註意到在重寫 Equals 過程中我們需要重寫 GetHashCode 方法。 所謂 Hash Code 就是用來生成和對象值對應的數字,從而高效的平衡哈希表的作用。 重寫 GetHashCode 方法是比較困難的,下麵我就來詳細講解一下重寫規則、方法和註意事項。重寫 GetHashCode 方法需要從性能、安全方面考慮,同時也需要滿足一些要求。
- 性能
由於哈希碼的返回值是 int 類型,因此會出現部分對象包含的值比 int 取值範圍大的情況,這時哈希碼就肯定會存在重覆的情況,所以這時我們要保證哈希碼的返回值儘可能的唯一。此外針對哈希碼的演算法我們要儘可能的保證返回的哈希碼應當在 int 類型取值範圍內平均分佈。在 Equals 中利用 GetHashCode 方法進行短路操作時我們必須對演算法的性能進行優化,避免將類型作為字典集合中的鍵類型使用,因為這會導致頻繁的調用 GetHashCode 方法。在設計 GetHashCode 的演算法時應保證良好的平衡性,即無論哈希表如何對哈希值進行 bucketing,也不會破壞平衡性。一般來說最理想的狀態是兩個對象間 1 bit 的差異應該造成哈希碼 16 bit 的差異。 - 安全
在安全性這方面首先應該遵循的是難以偽造哈希碼對象,一般來說攻擊者會向哈希表中寫入大量哈希值相同的數據,這時如果哈希表實現效率不高將會收到拒絕服務攻擊。我們一般會向來自相關類型的哈希碼使用異或操作,且保證操作數不相近或者相等。如果出現操作數相近或者相等的情況,那麼應該考慮使用位移和加法操作。但是多次使用 and 操作符會出現哈希值為 0 的情況,而多次使用 or 操作符則會出現哈希值為 1 的情況,這一點需要註意一下。更進一步的做法是,我們在開發中應該使用移位操作符來分解比 int 大的類型。 要求
要求是性能和安全的基礎,只要完全符合了要求的規定,性能和安全才能很好的起作用。要求的第一點也是最基礎的優點,相等的對象它們的哈希碼也相等,其次在特定的生命周期內,特定對象的 GetHashCode 的返回值始終是一樣的,最後 GetHashCode 不能引發任何異常,如果其中出現異常也必須返回一個值來表示內部出現異常。三、總結
本篇文章主要講解了重寫 object 中虛方法的知識,其中涉及到了很多 C# 核心內容,這些內容和知識在實際開發中用的很多,但是大多數開發人員並不在意,因此我希望讀者閱讀完我這篇文章後能對這些內容和知識有初步的瞭解。
本文由博客一文多發平臺 OpenWrite 發佈! 更多文章請掃碼關註公眾號:“喵叔呦”