Python自學--part1_ZenDei技術網路在線

概要一、Python介紹 python的創始人為吉多·範羅蘇姆（Guido van Rossum）。1989年的聖誕節期間，吉多·範羅蘇姆為了在阿姆斯特丹打發時間，決心開發一個新的腳本解釋程式，作為ABC語言的一種繼承。最新的TIOBE排行榜，Python趕超PHP占據第五， Python崇尚優 ...

概要

Python介紹
Python安裝
Hello World程式
變數
字元編碼
用戶輸入
pyc是個什麼鬼？
數據類型初識
數據運算
表達式if ...else語句
表達式while 迴圈
表達式for 迴圈

一、Python介紹

python的創始人為吉多·範羅蘇姆（Guido van Rossum）。1989年的聖誕節期間，吉多·範羅蘇姆為了在阿姆斯特丹打發時間，決心開發一個新的腳本解釋程式，作為ABC語言的一種繼承。

最新的TIOBE排行榜，Python趕超PHP占據第五， Python崇尚優美、清晰、簡單，是一個優秀並廣泛使用的語言。

Python可以應用於眾多領域，如：數據分析、組件集成、網路服務、圖像處理、數值計算和科學計算等眾多領域。目前業內幾乎所有大中型互聯網企業都在使用Python，如：Youtube、Dropbox、BT、Quora（中國知乎）、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、騰訊、汽車之家、美團等。

編譯和解釋的區別是什麼？

編譯器是把源程式的每一條語句都編譯成機器語言,並保存成二進位文件,這樣運行時電腦可以直接以機器語言來運行此程式,速度很快;

而解釋器則是只在執行程式時,才一條一條的解釋成機器語言給電腦來執行,所以運行速度是不如編譯後的程式運行的快的.

這是因為電腦不能直接認識並執行我們寫的語句,它只能認識機器語言(是二進位的形式)

編譯型vs解釋型

編譯型
優點：編譯器一般會有預編譯的過程對代碼進行優化。因為編譯只做一次，運行時不需要編譯，所以編譯型語言的程式執行效率高。可以脫離語言環境獨立運行。
缺點：編譯之後如果需要修改就需要整個模塊重新編譯。編譯的時候根據對應的運行環境生成機器碼，不同的操作系統之間移植就會有問題，需要根據運行的操作系統環境編譯不同的可執行文件。

解釋型
優點：有良好的平臺相容性，在任何環境中都可以運行，前提是安裝瞭解釋器（虛擬機）。靈活，修改代碼的時候直接修改就可以，可以快速部署，不用停機維護。

缺點：每次運行的時候都要解釋一遍，性能上不如編譯型語言。

Python的優缺點

先看優點

Python的定位是“優雅”、“明確”、“簡單”，所以Python程式看上去總是簡單易懂，初學者學Python，不但入門容易，而且將來深入下去，可以編寫那些非常非常複雜的程式。
開發效率非常高，Python有非常強大的第三方庫，基本上你想通過電腦實現任何功能，Python官方庫里都有相應的模塊進行支持，直接下載調用後，在基礎庫的基礎上再進行開發，大大降低開發周期，避免重覆造輪子。
高級語言————當你用Python語言編寫程式的時候，你無需考慮諸如如何管理你的程式使用的記憶體一類的底層細節
可移植性————由於它的開源本質，Python已經被移植在許多平臺上（經過改動使它能夠工作在不同平臺上）。如果你小心地避免使用依賴於系統的特性，那麼你的所有Python程式無需修改就幾乎可以在市場上所有的系統平臺上運行
可擴展性————如果你需要你的一段關鍵代碼運行得更快或者希望某些演算法不公開，你可以把你的部分程式用C或C++編寫，然後在你的Python程式中使用它們。
可嵌入性————你可以把Python嵌入你的C/C++程式，從而向你的程式用戶提供腳本功能。

再看缺點：

速度慢，Python 的運行速度相比C語言確實慢很多，跟JAVA相比也要慢一些，因此這也是很多所謂的大牛不屑於使用Python的主要原因，但其實這裡所指的運行速度慢在大多數情況下用戶是無法直接感知到的，必須藉助測試工具才能體現出來，比如你用C運一個程式花了0.01s,用Python是0.1s,這樣C語言直接比Python快了10倍,算是非常誇張了，但是你是無法直接通過肉眼感知的，因為一個正常人所能感知的時間最小單位是0.15-0.4s左右，哈哈。其實在大多數情況下Python已經完全可以滿足你對程式速度的要求，除非你要寫對速度要求極高的搜索引擎等，這種情況下，當然還是建議你用C去實現的。
代碼不能加密，因為PYTHON是解釋性語言，它的源碼都是以名文形式存放的，不過我不認為這算是一個缺點，如果你的項目要求源代碼必須是加密的，那你一開始就不應該用Python來去實現。
線程不能利用多CPU問題，這是Python被人詬病最多的一個缺點，GIL即全局解釋器鎖（Global Interpreter Lock），是電腦程式設計語言解釋器用於同步線程的工具，使得任何時刻僅有一個線程在執行，Python的線程是操作系統的原生線程。在Linux上為pthread，在Windows上為Win thread，完全由操作系統調度線程的執行。一個python解釋器進程內有一條主線程，以及多條用戶程式的執行線程。即使在多核CPU平臺上，由於GIL的存在，所以禁止多線程的並行執行。關於這個問題的折衷解決方法，我們在以後線程和進程章節里再進行詳細探討。

當然，Python還有一些其它的小缺點，在這就不一一列舉了，我想說的是，任何一門語言都不是完美的，都有擅長和不擅長做的事情，建議各位不要拿一個語言的劣勢去跟另一個語言的優勢來去比較，語言只是一個工具，是實現程式設計師思想的工具，就像我們之前中學學幾何時，有的時候需要要圓規，有的時候需要用三角尺一樣，拿相應的工具去做它最擅長的事才是正確的選擇。之前很多人問我Shell和Python到底哪個好？我回答說Shell是個腳本語言，但Python不只是個腳本語言，能做的事情更多，然後又有鑽牛角尖的人說完全沒必要學Python, Python能做的事情Shell都可以做，只要你足夠牛B,然後又舉了用Shell可以寫俄羅斯方塊這樣的游戲，對此我能說表達只能是，不要跟SB理論，SB會把你拉到跟他一樣的高度，然後用充分的經驗把你打倒。

Python解釋器

當我們編寫Python代碼時，我們得到的是一個包含Python代碼的以.py為擴展名的文本文件。要運行代碼，就需要Python解釋器去執行.py文件。

由於整個Python語言從規範到解釋器都是開源的，所以理論上，只要水平夠高，任何人都可以編寫Python解釋器來執行Python代碼（當然難度很大）。事實上，確實存在多種Python解釋器。

CPython

當我們從Python官方網站下載並安裝好Python 2.7後，我們就直接獲得了一個官方版本的解釋器：CPython。這個解釋器是用C語言開發的，所以叫CPython。在命令行下運行python就是啟動CPython解釋器。

CPython是使用最廣的Python解釋器。教程的所有代碼也都在CPython下執行。

IPython

IPython是基於CPython之上的一個互動式解釋器，也就是說，IPython只是在交互方式上有所增強，但是執行Python代碼的功能和CPython是完全一樣的。好比很多國產瀏覽器雖然外觀不同，但內核其實都是調用了IE。

CPython用>>>作為提示符，而IPython用In [序號]:作為提示符。

PyPy

PyPy是另一個Python解釋器，它的目標是執行速度。PyPy採用JIT技術，對Python代碼進行動態編譯（註意不是解釋），所以可以顯著提高Python代碼的執行速度。

絕大部分Python代碼都可以在PyPy下運行，但是PyPy和CPython有一些是不同的，這就導致相同的Python代碼在兩種解釋器下執行可能會有不同的結果。如果你的代碼要放到PyPy下執行，就需要瞭解PyPy和CPython的不同點。

Jython

Jython是運行在Java平臺上的Python解釋器，可以直接把Python代碼編譯成Java位元組碼執行。

IronPython

IronPython和Jython類似，只不過IronPython是運行在微軟.Net平臺上的Python解釋器，可以直接把Python代碼編譯成.Net的位元組碼。

小結

Python的解釋器很多，但使用最廣泛的還是CPython。如果要和Java或.Net平臺交互，最好的辦法不是用Jython或IronPython，而是通過網路調用來交互，確保各程式之間的獨立性。

二、Python安裝

windows

1 1、下載安裝包
2     https://www.python.org/downloads/
3 2、安裝
4     預設安裝路徑：C:\python27
5 3、配置環境變數
6     【右鍵電腦】--》【屬性】--》【高級系統設置】--》【高級】--》【環境變數】--》【在第二個內容框中找到 變數名為Path 的一行，雙擊】 --> 【Python安裝目錄追加到變值值中，用 ； 分割】
7     如：原來的值;C:\python27，切記前面有分號

linux、Mac

三、Hello World程式

1 print("Hello World!")

四、變數

聲明變數

1 #_*_coding:utf-8_*_
2  
3 name = "Richard Huang"

上述代碼聲明瞭一個變數，變數名為： name，變數name的值為："Richard Huang"

變數定義的規則：

變數名只能是字母、數字或下劃線（_）的任意組合
變數名的第一個字元不能是數字

以下關鍵字不能聲明為變數名
['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']

變數的賦值

1 name = "Richard Huang"
2  
3 name2 = name
4 print(name,name2)
5  
6 name = "Jack"
7 
8 print("What is the value of name2 now?")

以上代碼執行結果是：name 值為“Jack”,name2值為“Richard Huang”。“name2 = name”實際上是將name變數的值，賦值給了name2，而後面name變數又被賦了個新值“Jack”，而name2的值還是等於第一次賦的值“Richard Huang”。

五、字元編碼

python解釋器在載入 .py 文件中的代碼時，會對內容進行編碼（預設ascill）

ASCII（American Standard Code for Information Interchange，美國標準信息交換代碼）是基於拉丁字母的一套電腦編碼系統，主要用於顯示現代英語和其他西歐語言，其最多只能用 8 位來表示（一個位元組），即：2**8 = 256-1，所以，ASCII碼最多只能表示 255 個符號。

關於中文

為了處理漢字，程式員設計了用於簡體中文的GB2312和用於繁體中文的big5。

GB2312(1980年)一共收錄了7445個字元，包括6763個漢字和682個其它符號。漢字區的內碼範圍高位元組從B0-F7，低位元組從A1-FE，占用的碼位是72*94=6768。其中有5個空位是D7FA-D7FE。

GB2312 支持的漢字太少。1995年的漢字擴展規範GBK1.0收錄了21886個符號，它分為漢字區和圖形符號區。漢字區包括21003個字元。2000年的 GB18030是取代GBK1.0的正式國家標準。該標準收錄了27484個漢字，同時還收錄了藏文、蒙文、維吾爾文等主要的少數民族文字。現在的PC平臺必須支持GB18030，對嵌入式產品暫不作要求。所以手機、MP3一般只支持GB2312。

從ASCII、GB2312、GBK 到GB18030，這些編碼方法是向下相容的，即同一個字元在這些方案中總是有相同的編碼，後面的標準支持更多的字元。在這些編碼中，英文和中文可以統一地處理。區分中文編碼的方法是高位元組的最高位不為0。按照程式員的稱呼，GB2312、GBK到GB18030都屬於雙位元組字元集 (DBCS)。

有的中文Windows的預設內碼還是GBK，可以通過GB18030升級包升級到GB18030。不過GB18030相對GBK增加的字元，普通人是很難用到的，通常我們還是用GBK指代中文Windows內碼。

顯然ASCII碼無法將世界上的各種文字和符號全部表示，所以，就需要新出一種可以代表所有字元和符號的編碼，即：Unicode

Unicode（統一碼、萬國碼、單一碼）是一種在電腦上使用的字元編碼。Unicode 是為瞭解決傳統的字元編碼方案的局限而產生的，它為每種語言中的每個字元設定了統一併且唯一的二進位編碼，規定雖有的字元和符號最少由 16 位來表示（2個位元組），即：2 **16 = 65536，
註：此處說的的是最少2個位元組，可能更多

UTF-8，是對Unicode編碼的壓縮和優化，他不再使用最少使用2個位元組，而是將所有的字元和符號進行分類：ascii碼中的內容用1個位元組保存、歐洲的字元用2個位元組保存，東亞的字元用3個位元組保存...

所以，python解釋器在載入 .py 文件中的代碼時，會對內容進行編碼（預設ascill），如果是如下代碼的話：

報錯：ascii碼無法表示中文

1 #!/usr/bin/env python
2   
3 print "你好，世界"

改正：應該顯示的告訴python解釋器，用什麼編碼來執行源代碼，即：

1 #!/usr/bin/env python
2 # -*- coding: utf-8 -*-
3   
4 print "你好，世界"

註釋

　　當行註視：# 被註釋內容

　　多行註釋：""" 被註釋內容 """

六、用戶輸入

1 #!/usr/bin/env python
2 #_*_coding:utf-8_*_
3  
4  
5 #name = raw_input("What is your name?") #only on python 2.x
6 name = input("What is your name?")
7 print("Hello " + name )

輸入密碼時，如果想要不可見，需要利用getpass 模塊中的 getpass方法，即：

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3   
 4 import getpass
 5   
 6 # 將用戶輸入的內容賦值給 name 變數
 7 pwd = getpass.getpass("請輸入密碼：")
 8   
 9 # 列印輸入的內容
10 print(pwd)

七、pyc是個什麼鬼？

1. Python是一門解釋型語言？

我初學Python時，聽到的關於Python的第一句話就是，Python是一門解釋性語言，我就這樣一直相信下去，直到發現了*.pyc文件的存在。如果是解釋型語言，那麼生成的*.pyc文件是什麼呢？c應該是compiled的縮寫才對啊！

為了防止其他學習Python的人也被這句話誤解，那麼我們就在文中來澄清下這個問題，並且把一些基礎概念給理清。

2. 解釋型語言和編譯型語言

電腦是不能夠識別高級語言的，所以當我們運行一個高級語言程式的時候，就需要一個“翻譯機”來從事把高級語言轉變成電腦能讀懂的機器語言的過程。這個過程分成兩類，第一種是編譯，第二種是解釋。

編譯型語言在程式執行之前，先會通過編譯器對程式執行一個編譯的過程，把程式轉變成機器語言。運行時就不需要翻譯，而直接執行就可以了。最典型的例子就是C語言。

解釋型語言就沒有這個編譯的過程，而是在程式運行的時候，通過解釋器對程式逐行作出解釋，然後直接運行，最典型的例子是Ruby。

通過以上的例子，我們可以來總結一下解釋型語言和編譯型語言的優缺點，因為編譯型語言在程式運行之前就已經對程式做出了“翻譯”，所以在運行時就少掉了“翻譯”的過程，所以效率比較高。但是我們也不能一概而論，一些解釋型語言也可以通過解釋器的優化來在對程式做出翻譯時對整個程式做出優化，從而在效率上超過編譯型語言。

此外，隨著Java等基於虛擬機的語言的興起，我們又不能把語言純粹地分成解釋型和編譯型這兩種。

用Java來舉例，Java首先是通過編譯器編譯成位元組碼文件，然後在運行時通過解釋器給解釋成機器文件。所以我們說Java是一種先編譯後解釋的語言。

3. Python到底是什麼

其實Python和Java/C#一樣，也是一門基於虛擬機的語言，我們先來從錶面上簡單地瞭解一下Python程式的運行過程吧。

當我們在命令行中輸入python hello.py時，其實是激活了Python的“解釋器”，告訴“解釋器”：你要開始工作了。可是在“解釋”之前，其實執行的第一項工作和Java一樣，是編譯。

熟悉Java的同學可以想一下我們在命令行中如何執行一個Java的程式：

javac hello.java

java hello

只是我們在用Eclipse之類的IDE時，將這兩部給融合成了一部而已。其實Python也一樣，當我們執行python hello.py時，他也一樣執行了這麼一個過程，所以我們應該這樣來描述Python，Python是一門先編譯後解釋的語言。

4. 簡述Python的運行過程

在說這個問題之前，我們先來說兩個概念，PyCodeObject和pyc文件。

我們在硬碟上看到的pyc自然不必多說，而其實PyCodeObject則是Python編譯器真正編譯成的結果。我們先簡單知道就可以了，繼續向下看。

當python程式運行時，編譯的結果則是保存在位於記憶體中的PyCodeObject中，當Python程式運行結束時，Python解釋器則將PyCodeObject寫回到pyc文件中。

當python程式第二次運行時，首先程式會在硬碟中尋找pyc文件，如果找到，則直接載入，否則就重覆上面的過程。

所以我們應該這樣來定位PyCodeObject和pyc文件，我們說pyc文件其實是PyCodeObject的一種持久化保存方式。

八、數據類型初識

1、數字

2 是一個整數的例子。
長整數不過是大一些的整數。
3.23和52.3E-4是浮點數的例子。E標記表示10的冪。在這裡，52.3E-4表示52.3 * 10-4。
(-5+4j)和(2.3-4.6j)是複數的例子，其中-5,4為實數，j為虛數，數學中表示覆數是什麼？。

int（整型）

　　在32位機器上，整數的位數為32位，取值範圍為-2**31～2**31-1，即-2147483648～2147483647
　　在64位系統上，整數的位數為64位，取值範圍為-2**63～2**63-1，即-9223372036854775808～9223372036854775807 long（長整型）
　　跟C語言不同，Python的長整數沒有指定位寬，即：Python沒有限制長整數數值的大小，但實際上由於機器記憶體有限，我們使用的長整數數值不可能無限大。
　　註意，自從Python2.2起，如果整數發生溢出，Python會自動將整數數據轉換為長整數，所以如今在長整數數據後面不加字母L也不會導致嚴重後果了。
float（浮點型） 先掃盲 http://www.cnblogs.com/alex3714/articles/5895848.html
　　浮點數用來處理實數，即帶有小數的數字。類似於C語言中的double類型，占8個位元組（64位），其中52位表示底，11位表示指數，剩下的一位表示符號。
complex（複數）
　　複數由實數部分和虛數部分組成，一般形式為x＋yj，其中的x是複數的實數部分，y是複數的虛數部分，這裡的x和y都是實數。註：Python中存在小數字池：-5 ～ 257 2、布爾值　　真或假　　1 或 0 3、字元串

"hello world"

萬惡的字元串拼接：　　python中的字元串在C語言中體現為是一個字元數組，每次創建字元串時候需要在記憶體中開闢一塊連續的空，並且一旦需要修改字元串的話，就需要再次開闢空間，萬惡的+號每出現一次就會在內從中重新開闢一塊空間。 字元串格式化輸出

name = 'Jack'
print("i am %s"%name)

#輸出: i am Jack

#或者如下，建議用如下格式，因為後期有很多其他格式化，是通過如下格式內方法實現
print('i am {}'.format(name))

PS: 字元串是 %s;整數 %d;浮點數%f 字元串常用功能：

移除空白
分割
長度
索引
切片

4、列表創建列表：

1 name_list = ['jack', 'seven', 'eric']
2 或
3 name_list ＝ list(['jack', 'seven', 'eric'])

索引
切片
追加
刪除
長度
切片
迴圈
包含

5、元組(不可變列表) 創建元組：

1 ages = (11, 22, 33, 44, 55)
2 或
3 ages = tuple((11, 22, 33, 44, 55))

6、字典（無序）創建字典：

1 person = {"name": "Jack", 'age': 18}
2 或
3 person = dict({"name": "Jack", 'age': 18})

常用操作：

索引
新增
刪除
鍵、值、鍵值對
迴圈
長度

九、數據運算

　　算數運算：

比較運算：

賦值運算：

邏輯運算：

成員運算：

身份運算：

位運算：

運算符優先順序：

十、表達式：if...else

場景一、用戶登陸驗證

 1 # 提示輸入用戶名和密碼
 2   
 3 # 驗證用戶名和密碼
 4 #     如果錯誤，則輸出用戶名或密碼錯誤
 5 #     如果成功，則輸出 歡迎，XXX!
 6  
 7  
 8 #!/usr/bin/env python
 9 # -*- coding: encoding -*-
10   
11 import getpass
12   
13   
14 name = raw_input('請輸入用戶名：')
15 pwd = getpass.getpass('請輸入密碼：')
16   
17 if name == "alex" and pwd == "cmd":
18     print("歡迎，alex！")
19 else:
20     print("用戶名和密碼錯誤")

View Code

場景二、猜年齡游戲

在程式里設定好你的年齡，然後啟動程式讓用戶猜測，用戶輸入後，根據他的輸入提示用戶輸入的是否正確，如果錯誤，提示是猜大了還是小了

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3  
 4  
 5 my_age = 28
 6  
 7 user_input = int(input("input your guess num:"))
 8  
 9 if user_input == my_age:
10     print("Congratulations, you got it !")
11 elif user_input < my_age:
12     print("Oops,think bigger!")
13 else:
14     print("think smaller!")

View Code 外層變數，可以被內層代碼使用內層變數，不應被外層代碼使用

十一、表達式：while

有一種迴圈叫死迴圈，一經觸發，就運行個天荒地老、海枯石爛。

海枯石爛代碼

1 count = 0
2 while True:
3     print("你是風兒我是沙,纏纏綿綿到天涯...",count)
4     count +=1

View Code

其實除了時間，沒有什麼是永恆的，死loop還是少寫為好　

上面的代碼迴圈100次就退出吧

1 while True:
2     print("你是風兒我是沙,纏纏綿綿到天涯...",count)
3     count +=1
4     if count == 100:
5         print("去你媽的風和沙,你們這些脫了褲子是人,穿上褲子是鬼的臭男人..")
6         break

View Code

回到上面for 迴圈的例子，如何實現讓用戶不斷的猜年齡，但只給最多3次機會，再猜不對就退出程式。

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3  
 4  
 5 my_age = 28
 6  
 7 count = 0
 8 while count < 3:
 9     user_input = int(input("input your guess num:"))
10  
11     if user_input == my_age:
12         print("Congratulations, you got it !")
13         break
14     elif user_input < my_age:
15         print("Oops,think bigger!")
16     else:
17         print("think smaller!")
18     count += 1 #每次loop 計數器+1
19 else:
20     print("猜這麼多次都不對,你個笨蛋.")

View Code

十二、表達式：for

最簡單的迴圈10次

1 #_*_coding:utf-8_*_
2 __author__ = 'Alex Li'
3  
4  
5 for i in range(10):
6     print("loop:", i )

輸出：

 1 loop: 0
 2 loop: 1
 3 loop: 2
 4 loop: 3
 5 loop: 4
 6 loop: 5
 7 loop: 6
 8 loop: 7
 9 loop: 8
10 loop: 9

break：結束整個迴圈體

continue：結束當前迴圈，直接跳入下一次迴圈