10.文件和異常 學習處理文件,讓程式快速的分析大量數據,學習處理錯誤,避免程式在面對意外時崩潰。學習異常,異常是python創建的特殊對象,用於管理程式運行時出現的錯誤,提高程式的適用性,可用性,和穩定性。 學習模塊json,json可以用於保存用戶數據,避免程式意外停止運行時丟失。 學習處理文件 ...
10.文件和異常
學習處理文件,讓程式快速的分析大量數據,學習處理錯誤,避免程式在面對意外時崩潰。學習異常,異常是python創建的特殊對象,用於管理程式運行時出現的錯誤,提高程式的適用性,可用性,和穩定性。
學習模塊json,json可以用於保存用戶數據,避免程式意外停止運行時丟失。
學習處理文件和保存數據,可以讓程式使用起來更容易,用戶可以選擇輸入什麼類型的數據,並選擇在什麼時候輸入,並且可以在使用程式處理一些事後關閉程式,下次在繼續做。
學習處理異常,幫助應對文件不存在的情況,以及處理各種可能讓程式崩潰的問題,讓程式面對各種錯誤時更健壯,不管這些錯誤數據源自無意識的錯誤,還是源自破壞程式的惡意企圖。
10.1從文件中讀取數據
讀取文件可以一次性讀取整個文件,也可以逐行讀取文件。取決於文件的大小自行選擇讀取方法。
10.1.1讀取整個文件
在 Python 中,讀寫文件有 3 個步驟:
1.調用 open()函數,返回一個 File 對象。
2.調用 File 對象的 read()或 write()方法。
3.調用 File 對象的 close()方法,關閉該文件。
用 open()函數打開文件
with open(文件名) as file_object:
contents = file_object.read() #不用調用關閉方法,with自動關閉文件。
會在文件當前目錄下尋找文件打開。
read()方法讀取文件內容
File 對象的 read()方法:
>>> helloContent = helloFile.read() >>> helloContent 'Hello world!' |
可以使用 readlines()方法,從該文件取得一個字元串的列表。列表中的每個字元串就是文本中的每一行。
10.1.2文件路徑
註意斜杠、Windows 上的倒斜杠以及 OS X 和 Linux 上的正斜杠。
with open('text_files\filename.txt') as file_object。
有兩種方法指定一個文件路徑。
- “絕對路徑”, 總是從根文件夾開始。
- “相對路徑”,它相對於程式的當前工作目錄。
絕對文件路徑
Win:
file_path = 'C:\Users\ehmatthes\other_files\text_files\filename.txt’
with open(file_path) as file_object:
Linux和OS:
file_path = '/home/ehmatthes/other_files/text_files/filename.txt'
with open(file_path) as file_object:
還有點(.)和點點(..)文件夾。它們不是真正的文件夾,而是可以在路徑中使用的特殊名稱。單個的句點(“點”)用作文件夾目名稱時,是“這個目錄”的縮 寫。兩個句點(“點點”)意思是父文件夾。
處理絕對路徑和相對路徑
1.os.path 模塊提供了一些函數,返回一個相對路徑的絕對路徑,以及檢查給定的路徑是否為絕對路徑。
2.調用 os.path.abspath(path)將返回參數的絕對路徑的字元串。這是將相對路徑轉換為絕對路徑的簡便方法。
3.調用 os.path.isabs(path),如果參數是一個絕對路徑,就返回 True,如果參數是 一個相對路徑,就返回 False。
4.調用 os.path.relpath(path, start)將返回從 start 路徑到 path 的相對路徑的字元串。
5.如果沒有提供 start,就使用當前工作目錄作為開始路徑。
10.1.3逐行讀取文件數據
for line in lines:
replace()替換函數
file.replace(‘dog’, ‘cat’)
10.2寫入文件
10.2.1寫入空文件
open(‘file’, ‘w’)提供兩個實參,文件名和操作
1.讀取模式 ’r’
2.寫入模式 ‘w’
3.附加模式 ‘a’
4.讀取和寫入模式 ‘r+’
5.如果省略模式實參,python將只能預設只讀模式打開文件。
6.如果文件不存在,open將自動生成文件。
7.輸入是Input,輸出是Output,因此,我們把輸入輸出統稱為Input/Output,或者簡寫為IO。
8.輸入密碼時,如果想要不可見,需要利用getpass 模塊中的 getpass方法。
註意,如果以寫入模式 ‘w’ 打開,如果文件已經存在,將清空文件。
如果傳遞給 open()的文件名不存在,寫入模式和添加模式都會創建一個新的空文件。在讀取或寫入文件後,調用 close()方法,然後才能再次打開該文件。
Python只能將字元串寫入文本文件,要儲存數值數據進入文本文件,需要用函數str將其轉化為字元串格式。
>>> baconFile = open('bacon.txt', 'w') >>> baconFile.write('Hello world!\n') 13 >>> baconFile.close() >>> baconFile = open('bacon.txt', 'a') >>> baconFile.write('Bacon is not a vegetable.') 25 >>> baconFile.close() >>> baconFile = open('bacon.txt') >>> content = baconFile.read() >>> baconFile.close() >>> print(content) Hello world! Bacon is not a vegetable. |
首先,我們以寫模式打開 bacon.txt。因為還沒有 bacon.txt,Python 就創建了一 個。在打開的文件上調用 write(),並向 write()傳入字元串參數'Hello world! \n',將字元串寫入文件,並返回寫入的字元個數,包括換行符。然後關閉該文件。
為了將文本添加到文件已有的內容,而不是取代我們剛剛寫入的字元串,我們就以添加模式打開該文件。向該文件寫入'Bacon is not a vegetable.',並關閉它。最後,為了將文件的內容列印到屏幕上,我們以預設的讀模式打開該文件,調用 read(),將得到的內容保存在 content 中,關閉該文件,並列印 content。
請註意,write()方法不會像 print()函數那樣,在字元串的末尾自動添加換行字 符。必須自己添加該字元。
用 shelve 模塊保存變數
利用 shelve 模塊,你可以將 Python 程式中的變數保存到二進位的 shelf 文件中。 這樣,程式就可以從硬碟中恢復變數的數據。shelve 模塊讓你在程式中添加“保存” 和“打開”功能。例如,如果運行一個程式,並輸入了一些配置設置,就可以將這 些設置保存到一個 shelf 文件,然後讓程式下一次運行時載入它們。
>>> import shelve >>> shelfFile = shelve.open('mydata') >>> cats = ['Zophie', 'Pooka', 'Simon'] >>> shelfFile['cats'] = cats >>> shelfFile.close() |
在 Windows 上運行前面的代碼,你會看到在當前工作目錄下有 3 個新文件: mydata.bak、mydata.dat 和 mydata.dir。在 OS X 上,只會創建一個 mydata.db 文件。
這些二進位文件包含了存儲在 shelf 中的數據。這些二進位文件的格式並不重要,你只需要知道 shelve 模塊做了什麼,而不必知道它是怎麼做的。該模塊讓你不用操心如何將程式的數據保存到文件中。 你的程式稍後可以使用 shelve 模塊,重新打開這些文件並取出數據。shelf 值不必用讀模式或寫模式打開,因為它們在打開後,既能讀又能寫。
>>> shelfFile = shelve.open('mydata') >>> type(shelfFile) <class 'shelve.DbfilenameShelf'> >>> shelfFile['cats'] ['Zophie', 'Pooka', 'Simon'] >>> shelfFile.close() |
就像字典一樣,shelf 值有 keys()和 values()方法,返回 shelf 中鍵和值的類似列表的值。因為這些方法返回類似列表的值,而不是真正的列表,所以應該將它們傳 遞給 list()函數,取得列表的形式。
>>> shelfFile = shelve.open('mydata') >>> list(shelfFile.keys()) ['cats'] >>> list(shelfFile.values()) [['Zophie', 'Pooka', 'Simon']] >>> shelfFile.close() |
創建文件時,如果你需要在 Notepad 或 TextEdit 這樣的文本編輯器中讀取它們, 純文本就非常有用。但是,如果想要保存 Python 程式中的數據,那就使用 shelve 模塊。
10.2.2寫入多行
函數write()不會在寫入的文本後面自動換行,需要自己添加換行符\n。
10.3 OS操作
10.3.1用 os.makedirs()創建新文件夾
程式可以用 os.makedirs()函數創建新文件夾(目錄)。
>>> import os >>> os.makedirs('C:\\delicious\\walnut\\waffles') |
這不僅將創建 C:\delicious 文件夾,也會在 C:\delicious 下創建 walnut 文件夾, 併在 C:\delicious\walnut 中創建 waffles 文件夾。也就是說,os.makedirs()將創建所有 必要的中間文件夾,目的是確保完整路徑名存在。
10.3.2 os.path 模塊
os.path 模塊包含了許多與文件名和文件路徑相關的有用函數。
1.查看文件大小和文件夾內容
- 一旦有辦法處理文件路徑,就可以開始搜集特定文件和文件夾的信息。os.path 模塊提供了一些函數,用於查看文件的位元組數以及給定文件夾中的文件和子文件夾。
- 調用 os.path.getsize(path)將返回 path 參數中文件的位元組數。
- 調用 os.listdir(path)將返迴文件名字元串的列表,包含 path 參數中的每個文件(請註意,這個函數在 os 模塊中,而不是 os.path)。
- 使用了 os.path.join()來連接 文件夾名稱和當前的文件名。
2.檢查路徑有效性
- 如果你提供的路徑不存在,許多 Python 函數就會崩潰並報錯。os.path 模塊提 供了一些函數,用於檢測給定的路徑是否存在,以及它是文件還是文件夾。
- 如果 path 參數所指的文件或文件夾存在,調用 os.path.exists(path)將返回 True, 否則返回 False。
- 如果 path 參數存在,並且是一個文件,調用 os.path.isfile(path)將返回 True,否 則返回 False。
- 如果 path 參數存在,並且是一個文件夾,調用 os.path.isdir(path)將返回 True, 否則返回 False。
10.4組織文件
10.4.1 shutil 模塊
shutil(或稱為 shell 工具)模塊中包含一些函數,讓你在 Python 程式中複製、移動、改名和刪除文件。要使用shutil 的函數,首先需要 import shutil。
10.4.1.1複製文件和文件夾
shutil 模塊提供了一些函數,用於複製文件和整個文件夾。
1.調用shutil.copy(source, destination),將路徑 source 處的文件複製到路徑 destination 處的文件夾(source 和 destination 都是字元串)。
2.如果 destination 是一個文件名,它將 作為被覆制文件的新名字。該函數返回一個字元串,表示被覆制文件的路徑。
>>> import shutil, os >>> os.chdir('C:\\') >>> shutil.copy('C:\\spam.txt','C:\\delicious') 'C:\\delicious\\spam.txt' >>> shutil.copy('eggs.txt', 'C:\\delicious\\eggs2.txt') 'C:\\delicious\\eggs2.txt' |
10.4.1.2文件和文件夾的移動與改名
調用 shutil.move(source, destination),將路徑 source 處的文件夾移動到路徑 destination,並返回新位置的絕對路徑的字元串。
如果 destination 指向一個文件夾,source 文件將移動到 destination 中,並保持原來的文件名。
10.5異常
Python使用被稱為異常的特殊對象來管理程式運行時發生的錯誤。
每當python發生不知所措的錯誤時就會創建一個異常。
如果編寫了處理異常的情況,程式將會繼續進行,不然程式將會停止,並返回trackback,包含有關異常的報告。
異常使用 try-except 代碼塊來處理。執行指定的操作,告訴python改怎麼辦。使用 try-except 代碼塊,即使程式遇到錯誤,也會繼續運行,顯示自己編寫的友好錯誤提示,讓用戶知道哪裡錯了。
1.ZeroDivisionError異常
除數為0時,發生的異常。
2.TypeError異常
只允許整數和浮點數類型的參數。數據類型檢查可以用內置函數isinstance()實現
def my_abs(x): if not isinstance(x, (int, float)): raise TypeError('bad operand type') if x >= 0: return x else: return -x ValueError異常
|
3.記錄錯誤
Python內置的logging模塊可以非常容易地記錄錯誤信息。
4.拋出錯誤
如果要拋出錯誤,首先根據需要,可以定義一個錯誤的class,選擇好繼承關係,然後,用raise語句拋出一個錯誤的實例。
10.6存儲數據
使用json模塊來存儲數據。Json數據的格式並非python專用可以和用其他編程語言的人分享。是一種輕便格式,很有用,也易於學習。
JSON(JavaScript Object Notation)格式最初是為JavaScript開發的,但隨後成了一種常見格式,被用與眾多語言。
使用json.dump() 和json.load()
json.dump()接受兩個實參,要存儲的數據以及可用於存儲數據的文件對象。
- 存儲一組數字的程式 json.dump()
- 將數字讀取到記憶體的程式 json.load()
10.6.2保存和讀取用戶生成的數據
json.dump和json.load結合使用,分別是存儲和載入數據。
10.6.3重構
1.代碼可以正確運行,但可做進一步的改進——將代碼劃分為一系列完成具體工作的函數。這樣的過程叫重構。重構讓代碼更清晰,易於理解,更容易擴展。
2.將大部分邏輯放到一個或多個函數內。
10.6.4小結
1.學習了讀取文件,整個文件讀取和一行讀取,操作文件,打開,讀取模式,寫入模式,附加模式,讀取加寫入模式。
2.異常處理try-except-else代碼塊的使用方法。異常類型。操作數據,保存和讀取數據,json模塊的使用,dump和load的使用,學會重構代碼。
10.7調試
1.斷言
凡是用print()來輔助查看的地方,都可以用斷言(assert)來替代。
def foo(s): n = int(s) assert n != 0, 'n is zero!' return 10 / n
def main(): foo('0') |
assert的意思是,表達式n != 0應該是True,否則,根據程式運行的邏輯,後面的代碼肯定會出錯。
如果斷言失敗,assert語句本身就會拋出AssertionError。