在前面,我用了3篇文章解釋python的面向對象: 1. "面向對象:從代碼復用開始" 2. "面向對象:設置對象屬性" 3. "類和對象的名稱空間" 本篇是第4篇,用一個完整的示例來解釋面向對象的一些細節。 例子的模型是父類Employe和子類Manager,從類的定義開始,一步步完善直到類變得完 ...
在前面,我用了3篇文章解釋python的面向對象:
本篇是第4篇,用一個完整的示例來解釋面向對象的一些細節。
例子的模型是父類Employe和子類Manager,從類的定義開始,一步步完善直到類變得完整。
定義Employe類
現在,假設Employe類有3個屬性:名字name、職稱job和月薪水pay。
定義這個類:
class Employe():
def __init__(self, name, job=None, pay=0):
self.name = name
self.job = job
self.pay = pay
這裡為__init__()
的job參數提供了預設值:None,表示這個員工目前沒有職稱。對於沒有職稱的人,pay當然也應該是0。這樣創建Employe對象的時候,可以只給參數name。
例如:
if __name__ == "__main__":
longshuai = Employe("Ma Longshuai")
xiaofang = Employe("Gao Xiaofang", job="accountant", pay=15000)
上面的if判斷表示這個py文件如果當作可執行程式而不是模塊,則執行if內的語句,如果是以模塊的方式導入這個文件,則if內的語句不執行。這種用法在測試模塊代碼的時候非常方便。
運行該py文件,得到結果:
<__main__.Employe object at 0x01321690>
<__main__.Employe object at 0x01321610>
添加方法
每個Employe對象的name屬性由姓、名組成,中間空格分隔,現在想取出每個對象的名。對於普通的姓 名
字元串,可以使用字元串工具的split()函數來處理。
例如:
>>> name = "Ma Longshuai"
>>> name.split()[-1]
'Longshuai'
於是可以在longshuai和xiaofang這兩個Employe對象上:
print(longshuai.name.split()[-1])
print(xiaofang.name.split()[-1])
結果:
Longshuai
Xiaofang
與之類似的,如果想要為員工按10%加薪水,可以在每個Employe對象上:
xiaofang.pay *= 1.1
print(xiaofang.pay)
無論是截取name的名部分,還是加薪水的操作,都是Employe共用的,每個員工都可以這樣來操作。所以,更合理的方式是將它們定義為類的方法,以便後續的代碼復用:
class Employe():
def __init__(self, name, job=None, pay=0):
self.name = name
self.job = job
self.pay = pay
def lastName(self):
return self.name.split()[-1]
def giveRaise(self, percent):
self.pay = int(self.pay * (1 + percent))
if __name__ == "__main__":
longshuai = Employe("Ma Longshuai")
xiaofang = Employe("Gao Xiaofang", job="accountant", pay=15000)
print(longshuai.lastName())
print(xiaofang.lastName())
xiaofang.giveRaise(0.10)
print(xiaofang.pay)
上面的giveRaise()方法中使用了int()進行類型轉換,因為整數乘以一個小數,返回結果會是一個小數(例如15000 * 0.1 = 1500.0
)。這裡我們不想要這個小數,所以使用int()轉換成整數。
定義子類並重寫父類方法
現在定義Employe的子類Manager。
class Manager(Employe):
Manager的薪水計算方式是在原有薪水上再加一個獎金白分別,所以要重寫父類的giveRaise()方法。有兩種方式可以重寫:
- 完全否定父類方法
- 在父類方法的基礎上進行擴展
雖然有了父類的方法,拷貝修改很方便,但第一種重寫方式仍然是不合理的。合理的方式是採用第二種。
下麵是第一種方式重寫:
class Manager(Employe):
def giveRaise(self, percent, bonus=0.10):
self.pay = int(self.pay * (1 + percent + bonus))
這種重寫方式邏輯很簡單,但是完全否定了父類的giveRaise()方法,完完全全地重新定義了自己的方法。這種方式不合理,因為如果修改了Employe中的giveRaise()計算方法,Manager中的giveRaise()方法也要修改。
下麵是第二種在父類方法基礎上擴展,這是合理的重寫方式。
class Manager(Employe):
def giveRaise(self, percent, bonus=0.10):
Employe.giveRaise(self, percent + bonus)
第二種方式是在自己的giveRaise()方法中調用父類的giveRaise()方法。這樣的的好處是在需要修改薪水計算方式時,要麼只需修改Employe中的,要麼只需修改Manager中的,不會同時修改多個。
另外註意,上面是通過硬編碼的類名Employe來調用父類方法的,雖然不適合後期維護。但好在並沒有任何影響。因為調用時明確指定了第一個參數為self,而self代表的是對象自身,所以邏輯上仍然是對本對象的屬性self.pay進行修改。
Python支持另一隻更好的調用父類方法的方式:super()。這個函數有點複雜,但對於基本的調用父類方法來說,用法無比的簡單。修改上面的Manager類:
class Manager(Employe):
def __init__(self, name, pay):
super().__init__(name, "mgr", pay)
def giveRaise(self, percent, bonus=0.10):
super().giveRaise(percent + bonus)
測試下:
if __name__ == "__main__":
wugui = Manager("Wu Xiaogui", "mgr", 15000)
wugui.giveRaise(0.1, 0.1)
print(wugui.pay)
一般在重寫方法的時候,只要允許,就應該選擇在父類基礎上進行擴展重寫。如果真的需要定義完全不同的方法,可以不要重寫,而是在子類中定義新的方法。當然,如果真的有需求要重寫,且又要否定父類方法,那也沒辦法,不過這種情況基本上都是因為在類的設計上不合理。
定製子類構造方法
對於子類Manager,每次創建對象的時候其實沒有必要去傳遞一個參數"job=mgr"的參數,因為這是這個子類自然具備的。於是,在構造Manager對象的時候,可以讓它自動設置"job=mgr"。
所以,在Manager類中重寫__init__()
。既然涉及到了重寫,就有兩種方式:(1)完全否定父類方法,(2)在父類方法上擴展。無論何時,總應當選第二種。
以下是Manager類的定義:
class Manager(Employe):
def __init__(self, name, pay):
Employe.__init__(self, name, "mgr", pay)
def giveRaise(self, percent, bonus=0.10):
Employe.giveRaise(self, percent + bonus)
現在構造Manager對象的時候,只需給name和pay就可以:
if __name__ == "__main__":
wugui = Manager("Wu Xiaogui", 15000)
wugui.giveRaise(0.1, 0.1)
print(wugui.pay)
子類必須重寫方法
有些父類中的方法可能會要求子類必須重寫。
本文的這個示例不好解釋這一點。下麵簡單用父類Animal、子類Horse、子類Sheep、子類Cow來說明,這個例子來源於我寫的面向對象相關的第一篇文章:從代碼復用開始。
現在要為動物定義叫聲speak()方法,方法的作用是輸出"誰發出了什麼聲音"。看代碼即可理解:
class Animal:
def __init__(self, name):
self.name = name
def speak(self):
print(self.name + " speak " + self.sound())
def sound(self):
raise NotImplementedError("you must override this method")
在這段代碼中,speak()方法調用了sound()方法,但Animal類中的sound()方法卻明確拋出異常"你必須自己實現這個方法"。
為什麼呢?因為每種動物發出的叫聲不同,而這裡又是通過方法來返回叫聲的,不是通過屬性來表示叫聲的,所以每個子類必須定義自己的叫聲。如果子類不定義sound(),子類對象調用self.sound()
就會搜索到父類Animal的名稱空間上,而父類的sound()會拋出錯誤。
現在在子類中重寫sound(),但是Cow不重寫。
class Horse(Animal):
def sound(self):
return "neigh"
class Sheep(Animal):
def sound(self):
return "baaaah"
class Cow(Animal):
pass
測試:
h = Horse("horseA")
h.speak()
s = Sheep("sheepA")
s.speak()
c = Cow("cowA")
c.speak()
結果正如預期,h.speak()和s.speak()都正常輸出,但c.speak()會拋出"you must override this method"的異常。
再考慮一下,如果父類中不定義sound()會如何?同樣會在c.speak()時拋出錯誤。雖然都會終止程式,但是這已經脫離了面向對象的代碼復用原則:對於對象公有的屬性,都應該抽取到類中,對於類所公有的屬性,都應該抽取到父類中。sound()顯然是每種動物都應該具備的屬性,要麼定義為子類變數,要麼通過類方法來返回。
之前也提到過,如果可以,儘量不要定義類變數,因為這破壞了面向對象的封裝原則,打開了"黑匣子"。所以最合理的方法,還是每個子類重寫父類的sound(),且父類中的sound()強制要求子類重寫。
運算符重載
如果用print()去輸出我們自定義的類的對象,比如Employe對象,得到的都是一個元數據信息,比如包括類型和地址。
例如:
print(longshuai)
print(xiaofang)
## 結果:
<__main__.Employe object at 0x01321690>
<__main__.Employe object at 0x01321610>
我們可以自定義print()如何輸出對象,只需定義類的__str__()
方法即可。只要在類中自定義了這個方法,print()輸出對象的時候,就會自動調用這個__str__()
取得返回值,並將返回值輸出。
例如,在輸出每個Employe對象的時候,都輸出它的name、job、pay,並以一種自定義的格式輸出。
class Employe():
def __init__(self, name, job=None, pay=0):
self.name = name
self.job = job
self.pay = pay
def lastName(self):
return self.name.split()[-1]
def giveRaise(self, percent):
self.pay = int(self.pay * (1 + percent))
## 重載__str__()方法
def __str__(self):
return "[Employe: %s, %s, %s]" % (self.name, self.job, self.pay)
現在再print()輸出對象,將得到這個對象的信息,而不是這個對象的元數據:
print(longshuai)
print(xiaofang)
## 結果:
[Employe: Ma Longshuai, None, 0]
[Employe: Gao Xiaofang, accountant, 15000]
實際上,print()總是會調用對象的__str__()
,如果類中沒有定義__str__()
,就會查找父類中的__str__()
。這裡Employe的父類是祖先類object,它正好有一個__str__()
:
>>> object.__dict__["__str__"]
<slot wrapper '__str__' of 'object' objects>
換句話說,當Employe中定義了__str__()
,就意味著重載了父類object的__str__()
方法。而這個方法正好是被print()調用的,於是將這種行為稱之為"運算符重載"。
可能從print()上感受不到為什麼是運算符,換一個例子就很好理解了。__add__()
是決定加號+
運算模式的,比如3 + 2
之所以是5,是因為int類中定義了__add__()
。
>>> a=3
>>> type(a)
<class 'int'>
>>> int.__dict__["__add__"]
<slot wrapper '__add__' of 'int' objects>
這使得每次做數值加法運算的時候,都會調用這個__add__()
來決定如何做加法:
實際上在類中定義構造函數__init__()
也是運算符重載,它在每次創建對象的時候被調用。
還有很多運算符可以重載,加減乘除、字元串串聯、大小比較等等和運算符有關、無關的都可以被重載。在後面,會專門用一篇文章來介紹運算符重載。
序列化
對象也是一種數據結構,數據結構可以進行序列化。通過將對象序列化,可以實現對象的本地持久性存儲,還可以通過網路套接字發送給網路對端,然後通過反序列化可以還原得到完全相同的原始數據。
序列化非本文內容,此處僅是介紹一下該功能,後面我會寫幾篇專門介紹python序列化的文章。