**在本篇博客中,我們將全面、深入地探討Python中的文件操作。文件操作在Python編程中是不可或缺的一部分,它包含了打開、讀取、寫入和關閉文件等各種操作。我們將從基礎的文件操作講解到高級的文件處理技巧,以及如何優雅地使用Python進行文件操作。每一部分我們都會分享一些獨特的用法,並且附有具體 ...
在本篇博客中,我們將全面、深入地探討Python中的文件操作。文件操作在Python編程中是不可或缺的一部分,它包含了打開、讀取、寫入和關閉文件等各種操作。我們將從基礎的文件操作講解到高級的文件處理技巧,以及如何優雅地使用Python進行文件操作。每一部分我們都會分享一些獨特的用法,並且附有具體的示例代碼和輸出結果。在文章的最後,我們還將分享一些鮮為人知但非常實用的文件操作技巧。
基礎文件操作:打開、讀取、寫入和關閉文件
Python使用內置的open()
函數來打開一個文件,它返回一個文件對象,常用的模式如下:'r'表示讀取,'w'表示寫入(會先清空原有文件),'a'表示追加,'b'表示二進位模式。特別的,我們可以使用with
關鍵字,這樣當我們完成操作後,文件將自動關閉。
# 以讀取模式打開一個文件
with open('file.txt', 'r') as file:
content = file.read()
print(content)
當你運行這段代碼,假設file.txt
的內容是Hello, Python!
,你會看到以下輸出:
Hello, Python!
文件讀取:細粒度控制
除了一次性讀取整個文件,我們還可以以更小的單位來讀取文件。這對於處理大文件時非常有用,可以有效控制記憶體的使用。
with open('file.txt', 'r') as file:
while True:
line = file.readline()
if not line:
break
print(line, end='')
這段代碼會逐行讀取file.txt
文件的內容並列印。其中,end=''
是為了防止print
函數在每次列印後都插入一個換行符,因為從文件中讀取的每一行都已經帶有一個換行符。
文件寫入:內容追加與覆蓋
我們使用寫入模式('w')或追加模式('a')來寫入文件。這裡有一個小技巧:如果你的程式需要頻繁寫入文件,那麼在寫入時使用\n
來換行會比使用write()
函數後再使用write('\n')
函數來插入新行更有效率。
with open('file.txt', 'a') as file:
file.write('Hello, Python!\n')
這段代碼會在file.txt
文件的末尾追加一行Hello, Python!
。
更高級的文件處理:os
和shutil
模塊
Python的os
模塊和shutil
模塊為我們提供了更高級的文件操作功能,如重命名文件、刪除文件、創建
目錄、複製文件等。
import os
import shutil
# 創建一個新的目錄
os.mkdir('new_folder')
# 重命名文件
os.rename('old.txt', 'new.txt')
# 複製文件
shutil.copy2('src.txt', 'dst.txt')
# 刪除文件
os.remove('file_to_delete.txt')
運行這段代碼會按順序執行上述文件操作。
文件編碼:處理不同編碼格式的文件
在處理文件時,我們可能會遇到各種不同的編碼格式,如UTF-8, ASCII, ISO-8859-1等。Python的open()
函數允許我們通過encoding
參數來指定文件的編碼方式。
with open('file.txt', 'r', encoding='utf-8') as file:
content = file.read()
print(content)
如果你嘗試讀取一個包含非ASCII字元的文本文件,但沒有提供正確的編碼參數,Python可能會拋出UnicodeDecodeError
。在這種情況下,你需要知道文件的正確編碼格式才能正確地讀取文件。
# 嘗試讀取一個包含非ASCII字元的文件,但沒有指定正確的編碼格式
try:
with open('file.txt', 'r') as file:
content = file.read()
except UnicodeDecodeError:
print("UnicodeDecodeError occurred!")
這段代碼會捕獲UnicodeDecodeError
並列印一個錯誤消息。
文件異常處理:確保代碼的健壯性
在文件操作中,我們可能會遇到各種異常情況,例如文件不存在、沒有讀取/寫入許可權等。我們可以使用Python的異常處理機制來捕獲這些異常並作出相應的處理。
try:
with open('nonexistent_file.txt', 'r') as file:
content = file.read()
except FileNotFoundError:
print('File does not exist!')
except PermissionError:
print('No permission to read the file!')
這段代碼會捕獲FileNotFoundError
和PermissionError
,並分別列印出相應的錯誤消息。
使用pickle
進行對象序列化和反序列化
Python的pickle
模塊提供了將對象轉換為一種可以存儲到文件或在網路上傳輸的格式(這個過程稱為序列化),以及從這種格式重新構造對象(這個過程稱為反序列化)的功能。這是一種非常方便的方式來保存和載入Python對象。
import pickle
data = {
'name': 'John',
'age': 30,
'pets': ['cat', 'dog']
}
# 序列化並保存到文件
with open('data.pkl', 'wb') as file:
pickle.dump(data, file)
# 從文件載入並反序列化
with open('data.pkl', 'rb') as file:
loaded_data = pickle.load(file)
print(loaded_data)
運行這段代碼,你會看到以下輸出:
{'name': 'John', 'age': 30, 'pets': ['cat', 'dog']}
這就是原始的data
字典對象。
文件路徑處理
在處理文件路徑時,Python的os.path
模塊提供了一系列函數來解析、構造和修改文件路徑。這些函數都是跨平臺的,因此無論你的程式運行在Windows、macOS還是Linux上,都可以安全地使用它們。
import os
# 獲取文件的絕對路徑
abs_path = os.path.abspath('file.txt')
print(f'Absolute path: {abs_path}')
# 獲取文件所在的目錄
dir_name = os.path.dirname(abs_path)
print(f'Directory: {dir_name}')
# 獲取文件的基本名和擴展名
base_name = os.path.basename(abs_path)
print(f'Base name: {base_name}')
root, ext = os.path.splitext(base_name)
print(f'Root: {root}, Extension: {ext}')
假設file.txt
位於/home/user/documents/
目錄下,運行這段代碼會輸出:
Absolute path: /home/user/documents/file.txt
Directory: /home/user/documents
Base name: file.txt
Root: file, Extension: .txt
One More Thing: 文件遍歷和搜索
Python的os
模塊提供了一個os.walk()
函數,這是一個簡單易用但強大的工具,用於在目錄樹中生成文件名。結合fnmatch
模塊,我們可以實現對文件的模式匹配搜索。
import os
import fnmatch
def find(pattern, path):
result = []
for root, dirs, files in os.walk(path):
for name in fnmatch.filter(files, pattern):
result.append(os.path.join(root, name))
return result
# 查找當前目錄及其所有子目錄中的所有.txt文件
print(find('*.txt', '.'))
假設當前目錄及其子目錄下有file1.txt
, file2.txt
, sub/file3.txt
三個文件,運行這段代碼會輸出:
['./file1.txt', './file2.txt', './sub/file3.txt']
我們希望你能從這篇博客中學到Python文件操作的各種技巧,並能在你的Python編程之旅中發揮作用。如果你有任何問題或想法,歡迎留言交流。
如有幫助,請多關註
個人微信公眾號:【Python全視角】
TeahLead_KrisChang,10+年的互聯網和人工智慧從業經驗,10年+技術和業務團隊管理經驗,同濟軟體工程本科,復旦工程管理碩士,阿裡雲認證雲服務資深架構師,上億營收AI產品業務負責人。