恢復內容開始 Python的作者,Guido von Rossum,確實是荷蘭人。1982年,Guido從阿姆斯特丹大學(University of Amsterdam)獲得了數學和電腦碩士學位。然而,儘管他算得上是一位數學家,但他更加享受電腦帶來的樂趣。用他的話說,儘管擁有數學和電腦雙料資質 ...
---恢復內容開始---
Python的作者,Guido von Rossum,確實是荷蘭人。1982年,Guido從阿姆斯特丹大學(University of Amsterdam)獲得了數學和電腦碩士學位。然而,儘管他算得上是一位數學家,但他更加享受電腦帶來的樂趣。用他的話說,儘管擁有數學和電腦雙料資質,他總趨向於做電腦相關的工作,並熱衷於做任何和編程相關的活兒。
在那個時候,他接觸並使用過諸如Pascal、C、 Fortran等語言。這些語言的基本設計原則是讓機器能更快運行。在80年代,雖然IBM和蘋果已經掀起了個人電腦浪潮,但這些個人電腦的配置很低 (在今天看來)。比如早期的Macintosh,只有8MHz的CPU主頻和128KB的RAM,一個大的數組就能占滿記憶體。所有的編譯器的核心是做優化,以便讓程式能夠運行。為了增進效率,語言也迫使程式員像電腦一樣思考,以便能寫出更符合機器口味的程式。在那個時代,程式員恨不得用手榨取電腦每一寸的能力。有人甚至認為C語言的指針是在浪費記憶體。至於動態類型,記憶體自動管理,面向對象…… 別想了,那會讓你的電腦陷入癱瘓。
然而,這種思考方式讓Guido感到苦惱。Guido知道如何用C語言寫出一個功能,但整個編寫過程需要耗費大量的時間 (即使他已經準確的知道瞭如何實現)。他的另一個選擇是shell。Bourne Shell作為UNIX系統的解釋器(interpreter)已經長期存在。UNIX的管理員們常常用shell去寫一些簡單的腳本,以進行一些系統維護的工作,比如定期備份、文件系統管理等等。shell可以像膠水一樣,將UNIX下的許多功能連接在一起。許多C語言下上百行的程式,在shell下只用幾行就可以完成。然而,shell的本質是調用命令。它並不是一個真正的語言。比如說,shell沒有數值型的數據類型,加法運算都很複雜。總之,shell不能全面的調動電腦的功能。
(關於shell,你可以參考Linux架構和Linux命令行與命令)
Guido希望有一種語言,這種語言能夠像C語言那樣,能夠全面調用電腦的功能介面,又可以像shell那樣,可以輕鬆的編程。ABC語言讓Guido看到希望。ABC是由荷蘭的CWI (Centrum Wiskunde & Informatica, 數學和電腦研究所)開發的。Guido在CWI工作,並參與到ABC語言的開發。ABC語言以教學為目的。與當時的大部分語言不同,ABC語言的目標是“讓用戶感覺更好”。ABC語言希望讓語言變得容易閱讀,容易使用,容易記憶,容易學習,並以此來激發人們學習編程的興趣。比如下麵是一段來自Wikipedia的ABC程式,這個程式用於統計文本中出現的詞(word)的總數:
HOW TO RETURN words document: PUT {} IN collection FOR line IN document: FOR word IN split line: IF word not.in collection: INSERT word IN collection RETURN collection
HOW TO用於定義一個函數。一個Python程式員應該很容易理解這段程式。ABC語言使用冒號(:)和縮進來表示程式塊(C語言使用{}來表示程式塊)。行尾沒有分號。for和if結構中也沒有括弧()。如果將HOW TO改為def,將PUT行改為collection = [],將INSERT行改為collection.append(word),這就幾乎是一個標準的Python函數。上面的函數讀起來就像一段自然的文字。
儘管已經具備了良好的可讀性和易用性,ABC語言最終沒有流行起來。在當時,ABC語言編譯器需要比較高配置的電腦才能運行。而這些電腦的使用者通常精通電腦,他們更多考慮程式的效率,而非它的學習難度。除了硬體上的困難外,ABC語言的設計也存在一些致命的問題:
- 可拓展性差。ABC語言不是模塊化語言。如果想在ABC語言中增加功能,比如對圖形化的支持,就必須改動很多地方。
- 不能直接進行IO。ABC語言不能直接操作文件系統。儘管你可以通過諸如文本流的方式導入數據,但ABC無法直接讀寫文件。輸入輸出的困難對於電腦語言來說是致命的。你能想像一個打不開車門的跑車麽?
- 過度革新。ABC用自然語言的方式來表達程式的意義,比如上面程式中的HOW TO (如何)。然而對於程式員來說,他們更習慣用function或者define來定義一個函數。同樣,程式員也習慣了用等號(=)來分配變數。這儘管讓ABC語言顯得特別,但實際上增加了程式員的學習難度 (程式員大都掌握不止一種語言)。
- 傳播困難。ABC編譯器很大,必須被保存在磁帶(tape)上。當時Guido在訪問的時候,就必須有一個大磁帶來給別人安裝ABC編譯器。 這樣,ABC語言就很難快速傳播。
IBM tape drive:讀寫磁帶
1989年,為了打發聖誕節假期,Guido開始寫Python語言的編譯/解釋器。Python來自Guido所摯愛的電視劇Monty Python's Flying Circus (BBC1960-1970年代播放的室內情景幽默劇,以當時的英國生活為素材)。他希望這個新的叫做Python的語言,能實現他的理念(一種C和shell之間,功能全面,易學易用,可拓展的語言)。Guido作為一個語言設計愛好者,已經有過設計語言的(不很成功)的嘗試。這一次,也不過是一次純粹的hacking行為。
Python的誕生
1991年,第一個Python編譯器(同時也是解釋器)誕生。它是用C語言實現的,並能夠調用C庫(.so文件)。從一齣生,Python已經具有了:類(class),函數(function),異常處理(exception),包括表(list)和詞典(dictionary)在內的核心數據類型,以及模塊(module)為基礎的拓展系統。
最初的Python logo: 由Guido的兄弟Just von Rossum設計
Python語法很多來自C,但又受到ABC語言的強烈影響。來自ABC語言的一些規定直到今天還富有爭議,比如強制縮進。但這些語法規定讓Python容易讀。另一方面,Python聰明的選擇服從一些慣例(特別是C語言的慣例)。比如使用等號賦值,使用def來定義函數。Guido認為,如果“常識”上確立的東西,沒有必要過度糾結。
Python從一開始就特別在意可拓展性(extensibility)。Python可以在多個層次上拓展。從高層上,你可以引入.py文件。在底層,你可以引用C語言的庫。Python程式員可以快速的使用Python寫.py文件作為拓展模塊。但當性能是考慮的重要因素時,Python程式員可以深入底層,寫C程式,編譯為.so文件引入到Python中使用。Python就好像是使用鋼構建房一樣,先規定好大的框架。而程式員可以在此框架下相當自由的拓展或更改。
最初的Python完全由Guido本人開發。Python得到Guido同事的歡迎。他們迅速的反饋使用意見,並參與到Python的改進。Guido和一些同事構成Python的核心團隊。他們將自己大部分的業餘時間用於hack Python (也包括工作時間,因為他們將Python用於工作)。隨後,Python拓展到CWI之外。Python將許多機器層面上的細節隱藏,交給編譯器處理,並凸顯出邏輯層面的編程思考。Python程式員可以花更多的時間用於思考程式的邏輯,而不是具體的實現細節 (Guido有一件T恤,寫著:人生苦短,我用Python)。這一特征吸引了廣大的程式員。Python開始流行。
我們不得不暫停我們的Python時間,轉而看一看這時的電腦概況。1990年代初,個人電腦開始進入普通家庭。Intel發佈了486處理器,windows發佈window 3.0開始的一系列視窗系統。電腦的性能大大提高。程式員開始關註電腦的易用性 (比如圖形化界面)。
Windows 3.0
由於電腦性能的提高,軟體的世界也開始隨之改變。硬體足以滿足許多個人電腦的需要。硬體廠商甚至渴望高需求軟體的出現,以帶動硬體的更新換代。C++和Java相繼流行。C++和Java提供了面向對象的編程範式,以及豐富的對象庫。在犧牲了一定的性能的代價下,C++和Java大大提高了程式的產量。語言的易用性被提到一個新的高度。我們還記得,ABC失敗的一個重要原因是硬體的性能限制。從這方面說,Python要比ABC幸運許多。
另一個悄然發生的改變是Internet。1990年代還是個人電腦的時代,windows和Intel挾PC以令天下,盛極一時。儘管Internet為主體的信息革命尚未到來,但許多程式員以及資深電腦用戶已經在頻繁使用Internet進行交流 (包括email和newsgroup)。Internet讓信息交流成本大大下降。一種新的軟體開發模式開始流行:開源 (open source)。程式員利用業餘時間進行軟體開發,並開放源代碼。1991年,Linus在comp.os.minix新聞組上發佈了Linux內核源代碼,吸引大批hacker的加入。Linux和GNU相互合作,最終構成了一個充滿活力的開源平臺。
硬體性能不是瓶頸,Python又容易使用,所以許多人開始轉向Python。Guido維護了一個maillist,Python用戶就通過郵件進行交流。Python用戶來自許多領域,有不同的背景,對Python也有不同的需求。Python相當的開放,又容易拓展,所以當用戶不滿足於現有功能,很容易對Python進行拓展或改造。隨後,這些用戶將改動發給Guido,並由Guido決定是否將新的特征加入到Python或者標準庫中。如果代碼能被納入Python自身或者標準庫,這將極大的榮譽。Python自身也因此變得更好。
(Guido不得不作出許多決定,這也是他被稱為Benevolent Dictator For Life的原因)
Python被稱為“Battery Included”,是說它以及其標準庫的功能強大。這些是整個社區的貢獻。Python的開發者來自不同領域,他們將不同領域的優點帶給Python。比如Python標準庫中的正則表達(regular expression)是參考Perl,而lambda, map, filter, reduce函數參考Lisp。Python本身的一些功能以及大部分的標準庫來自於社區。Python的社區不斷擴大,進而擁有了自己的newsgroup,網站(python.org),以及基金 (Python Software Foundation)。從Python 2.0開始,Python也從maillist的開發方式,轉為完全開源的開發方式。社區氣氛已經形成,工作被整個社區分擔,Python也獲得了更加高速的發展。
(由於Guido享有絕對的仲裁權,所以在Python早期maillist的開發時代,不少愛好者相當擔心Guido的生命。他們甚至作出假設:如果Guido掛了的話,Python會怎樣。見If Guido was hit by a bus)
到今天,Python的框架已經確立。Python語言以對象為核心組織代碼(Everything is object),支持多種編程範式(multi-paradigm),採用動態類型(dynamic typing),自動進行記憶體回收(garbage collection)。Python支持解釋運行(interpret),並能調用C庫進行拓展。Python有強大的標準庫 (battery included)。由於標準庫的體系已經穩定,所以Python的生態系統開始拓展到第三方包。這些包,如Django, web.py, wxpython, numpy, matplotlib,PIL,將Python升級成了物種豐富的熱帶雨林。
今天Python已經進入到3.0的時代。由於Python 3.0向後不相容,所以從2.0到3.0的過渡並不容易。另一方面,Python的性能依然值得改進,Python的運算性能低於C++和Java(見Google的討論)。Python依然是一個在發展中的語言。我期待看到Python的未來。
Python啟示錄
Python崇尚優美、清晰、簡單,是一個優秀並廣泛使用的語言 (TIOBE語言排行第八,Google的第三大開發語言,Dropbox的基礎語言,豆瓣的伺服器語言)。這個世界並不缺乏優秀的語言,但Python的發展史作為一個代表,帶給我許多啟示。
在Python的開發過程中,社區起到了重要的作用。Guido自認為自己不是全能型的程式員,所以他只負責制訂框架。如果問題太複雜,他會選擇繞過去,也就是cut the corner。這些問題最終由社區中的其他人解決。社區中的人才是異常豐富的,就連創建網站,籌集基金這樣與開發稍遠的事情,也有人樂意於處理。如今的項目開發越來越複雜,越來越龐大,合作以及開放的心態成為項目最終成功的關鍵。
Python從其他語言中學到了很多,無論是已經進入歷史的ABC,還是依然在使用的C和Perl,以及許多沒有列出的其他語言。可以說,Python的成功代表了它所有借鑒的語言的成功。同樣,Ruby借鑒了Python,它的成功也代表了Python某些方面的成功。每個語言都是混合體,都有它優秀的地方,但也有各種各樣的缺陷。同時,一個語言“好與不好”的評判,往往受制於平臺、硬體、時代等等外部原因。程式員經歷過許多語言之爭。我想,為什麼不以開放的心態和客觀的分析,去區分一下每個語言的具體優點缺點,去區分內部和外部的因素。說不定哪一天發現,我不喜歡的某個語言中,正包含了我所需要的東西。
無論Python未來的命運如何,Python的歷史已經是本很有趣的小說。
---恢復內容結束---