Python面向對象基礎：編碼細節和註意事項

在前面，我用了3篇文章解釋python的面向對象： 1. "面向對象：從代碼復用開始" 2. "面向對象：設置對象屬性" 3. "類和對象的名稱空間" 本篇是第4篇，用一個完整的示例來解釋面向對象的一些細節。例子的模型是父類Employe和子類Manager，從類的定義開始，一步步完善直到類變得完 ...

在前面，我用了3篇文章解釋python的面向對象：

本篇是第4篇，用一個完整的示例來解釋面向對象的一些細節。

例子的模型是父類Employe和子類Manager，從類的定義開始，一步步完善直到類變得完整。

定義Employe類

現在，假設Employe類有3個屬性：名字name、職稱job和月薪水pay。

定義這個類：

class Employe():
    def __init__(self, name, job=None, pay=0):
        self.name = name
        self.job = job
        self.pay = pay

這裡為__init__()的job參數提供了預設值：None，表示這個員工目前沒有職稱。對於沒有職稱的人，pay當然也應該是0。這樣創建Employe對象的時候，可以只給參數name。

例如：

if __name__ == "__main__":
    longshuai = Employe("Ma Longshuai")
    xiaofang = Employe("Gao Xiaofang", job="accountant", pay=15000)

上面的if判斷表示這個py文件如果當作可執行程式而不是模塊，則執行if內的語句，如果是以模塊的方式導入這個文件，則if內的語句不執行。這種用法在測試模塊代碼的時候非常方便。

運行該py文件，得到結果：

<__main__.Employe object at 0x01321690>
<__main__.Employe object at 0x01321610>

添加方法

每個Employe對象的name屬性由姓、名組成，中間空格分隔，現在想取出每個對象的名。對於普通的姓名字元串，可以使用字元串工具的split()函數來處理。

例如：

>>> name = "Ma Longshuai"
>>> name.split()[-1]
'Longshuai'

於是可以在longshuai和xiaofang這兩個Employe對象上：

print(longshuai.name.split()[-1])
print(xiaofang.name.split()[-1])

結果：

Longshuai
Xiaofang

與之類似的，如果想要為員工按10%加薪水，可以在每個Employe對象上：

xiaofang.pay *= 1.1
print(xiaofang.pay)

無論是截取name的名部分，還是加薪水的操作，都是Employe共用的，每個員工都可以這樣來操作。所以，更合理的方式是將它們定義為類的方法，以便後續的代碼復用：

class Employe():
    def __init__(self, name, job=None, pay=0):
        self.name = name
        self.job = job
        self.pay = pay

    def lastName(self):
        return self.name.split()[-1]

    def giveRaise(self, percent):
        self.pay = int(self.pay * (1 + percent))

if __name__ == "__main__":
    longshuai = Employe("Ma Longshuai")
    xiaofang = Employe("Gao Xiaofang", job="accountant", pay=15000)
    
    print(longshuai.lastName())
    print(xiaofang.lastName())
    xiaofang.giveRaise(0.10)
    print(xiaofang.pay)

上面的giveRaise()方法中使用了int()進行類型轉換，因為整數乘以一個小數，返回結果會是一個小數(例如15000 * 0.1 = 1500.0)。這裡我們不想要這個小數，所以使用int()轉換成整數。

定義子類並重寫父類方法

現在定義Employe的子類Manager。

class Manager(Employe):

Manager的薪水計算方式是在原有薪水上再加一個獎金白分別，所以要重寫父類的giveRaise()方法。有兩種方式可以重寫：

完全否定父類方法
在父類方法的基礎上進行擴展

雖然有了父類的方法，拷貝修改很方便，但第一種重寫方式仍然是不合理的。合理的方式是採用第二種。

下麵是第一種方式重寫：

class Manager(Employe):
    def giveRaise(self, percent, bonus=0.10):
        self.pay = int(self.pay * (1 + percent + bonus))

這種重寫方式邏輯很簡單，但是完全否定了父類的giveRaise()方法，完完全全地重新定義了自己的方法。這種方式不合理，因為如果修改了Employe中的giveRaise()計算方法，Manager中的giveRaise()方法也要修改。

下麵是第二種在父類方法基礎上擴展，這是合理的重寫方式。

class Manager(Employe):
    def giveRaise(self, percent, bonus=0.10):
        Employe.giveRaise(self, percent + bonus)

第二種方式是在自己的giveRaise()方法中調用父類的giveRaise()方法。這樣的的好處是在需要修改薪水計算方式時，要麼只需修改Employe中的，要麼只需修改Manager中的，不會同時修改多個。

另外註意，上面是通過硬編碼的類名Employe來調用父類方法的，雖然不適合後期維護。但好在並沒有任何影響。因為調用時明確指定了第一個參數為self，而self代表的是對象自身，所以邏輯上仍然是對本對象的屬性self.pay進行修改。

Python支持另一隻更好的調用父類方法的方式：super()。這個函數有點複雜，但對於基本的調用父類方法來說，用法無比的簡單。修改上面的Manager類：

class Manager(Employe):
    def __init__(self, name, pay):
        super().__init__(name, "mgr", pay)

    def giveRaise(self, percent, bonus=0.10):
        super().giveRaise(percent + bonus)

測試下：

if __name__ == "__main__":
    wugui = Manager("Wu Xiaogui", "mgr", 15000)
    wugui.giveRaise(0.1, 0.1)
    print(wugui.pay)

一般在重寫方法的時候，只要允許，就應該選擇在父類基礎上進行擴展重寫。如果真的需要定義完全不同的方法，可以不要重寫，而是在子類中定義新的方法。當然，如果真的有需求要重寫，且又要否定父類方法，那也沒辦法，不過這種情況基本上都是因為在類的設計上不合理。

定製子類構造方法

對於子類Manager，每次創建對象的時候其實沒有必要去傳遞一個參數"job=mgr"的參數，因為這是這個子類自然具備的。於是，在構造Manager對象的時候，可以讓它自動設置"job=mgr"。

所以，在Manager類中重寫__init__()。既然涉及到了重寫，就有兩種方式：(1)完全否定父類方法，(2)在父類方法上擴展。無論何時，總應當選第二種。

以下是Manager類的定義：

class Manager(Employe):
    def __init__(self, name, pay):
        Employe.__init__(self, name, "mgr", pay)

    def giveRaise(self, percent, bonus=0.10):
        Employe.giveRaise(self, percent + bonus)

現在構造Manager對象的時候，只需給name和pay就可以：

if __name__ == "__main__":
    wugui = Manager("Wu Xiaogui", 15000)
    wugui.giveRaise(0.1, 0.1)
    print(wugui.pay)

子類必須重寫方法

有些父類中的方法可能會要求子類必須重寫。

本文的這個示例不好解釋這一點。下麵簡單用父類Animal、子類Horse、子類Sheep、子類Cow來說明，這個例子來源於我寫的面向對象相關的第一篇文章：從代碼復用開始。

現在要為動物定義叫聲speak()方法，方法的作用是輸出"誰發出了什麼聲音"。看代碼即可理解：

class Animal:
    def __init__(self, name):
        self.name = name
    def speak(self):
        print(self.name + " speak " + self.sound())
    def sound(self):
        raise NotImplementedError("you must override this method")

在這段代碼中，speak()方法調用了sound()方法，但Animal類中的sound()方法卻明確拋出異常"你必須自己實現這個方法"。

為什麼呢？因為每種動物發出的叫聲不同，而這裡又是通過方法來返回叫聲的，不是通過屬性來表示叫聲的，所以每個子類必須定義自己的叫聲。如果子類不定義sound()，子類對象調用self.sound()就會搜索到父類Animal的名稱空間上，而父類的sound()會拋出錯誤。

現在在子類中重寫sound()，但是Cow不重寫。

class Horse(Animal):
    def sound(self):
        return "neigh"

class Sheep(Animal):
    def sound(self):
        return "baaaah"

class Cow(Animal):
    pass

測試：

h = Horse("horseA")
h.speak()

s = Sheep("sheepA")
s.speak()

c = Cow("cowA")
c.speak()

結果正如預期，h.speak()和s.speak()都正常輸出，但c.speak()會拋出"you must override this method"的異常。

再考慮一下，如果父類中不定義sound()會如何？同樣會在c.speak()時拋出錯誤。雖然都會終止程式，但是這已經脫離了面向對象的代碼復用原則：對於對象公有的屬性，都應該抽取到類中，對於類所公有的屬性，都應該抽取到父類中。sound()顯然是每種動物都應該具備的屬性，要麼定義為子類變數，要麼通過類方法來返回。

之前也提到過，如果可以，儘量不要定義類變數，因為這破壞了面向對象的封裝原則，打開了"黑匣子"。所以最合理的方法，還是每個子類重寫父類的sound()，且父類中的sound()強制要求子類重寫。

運算符重載

如果用print()去輸出我們自定義的類的對象，比如Employe對象，得到的都是一個元數據信息，比如包括類型和地址。

例如：

print(longshuai)
print(xiaofang)

## 結果：
<__main__.Employe object at 0x01321690>
<__main__.Employe object at 0x01321610>

我們可以自定義print()如何輸出對象，只需定義類的__str__()方法即可。只要在類中自定義了這個方法，print()輸出對象的時候，就會自動調用這個__str__()取得返回值，並將返回值輸出。

例如，在輸出每個Employe對象的時候，都輸出它的name、job、pay，並以一種自定義的格式輸出。

class Employe():
    def __init__(self, name, job=None, pay=0):
        self.name = name
        self.job = job
        self.pay = pay

    def lastName(self):
        return self.name.split()[-1]

    def giveRaise(self, percent):
        self.pay = int(self.pay * (1 + percent))

    ## 重載__str__()方法
    def __str__(self):
        return "[Employe: %s, %s, %s]" % (self.name, self.job, self.pay)

現在再print()輸出對象，將得到這個對象的信息，而不是這個對象的元數據：

print(longshuai)
print(xiaofang)

## 結果：
[Employe: Ma Longshuai, None, 0]
[Employe: Gao Xiaofang, accountant, 15000]

實際上，print()總是會調用對象的__str__()，如果類中沒有定義__str__()，就會查找父類中的__str__()。這裡Employe的父類是祖先類object，它正好有一個__str__()：

>>> object.__dict__["__str__"]
<slot wrapper '__str__' of 'object' objects>

換句話說，當Employe中定義了__str__()，就意味著重載了父類object的__str__()方法。而這個方法正好是被print()調用的，於是將這種行為稱之為"運算符重載"。

可能從print()上感受不到為什麼是運算符，換一個例子就很好理解了。__add__()是決定加號+運算模式的，比如3 + 2之所以是5，是因為int類中定義了__add__()。

>>> a=3
>>> type(a)
<class 'int'>

>>> int.__dict__["__add__"]
<slot wrapper '__add__' of 'int' objects>

這使得每次做數值加法運算的時候，都會調用這個__add__()來決定如何做加法：

實際上在類中定義構造函數__init__()也是運算符重載，它在每次創建對象的時候被調用。

還有很多運算符可以重載，加減乘除、字元串串聯、大小比較等等和運算符有關、無關的都可以被重載。在後面，會專門用一篇文章來介紹運算符重載。

序列化

對象也是一種數據結構，數據結構可以進行序列化。通過將對象序列化，可以實現對象的本地持久性存儲，還可以通過網路套接字發送給網路對端，然後通過反序列化可以還原得到完全相同的原始數據。

序列化非本文內容，此處僅是介紹一下該功能，後面我會寫幾篇專門介紹python序列化的文章。