文件的操作 + 打開文件 2.對文件句柄進行操作 3.關閉文件。 open() 有三個參數:1. 文件路徑 (文件夾路徑+文件名+文件類型) 2. 編碼方式(encoding)3. 模式(mode) open: 內置函數,open底層調用的是操作系統的介面。 fl: 變數,一般在文件操作時設置的約定 ...
文件的操作
- 打開文件 2.對文件句柄進行操作 3.關閉文件。
open() 有三個參數:1. 文件路徑 (文件夾路徑+文件名+文件類型) 2. 編碼方式(encoding)3. 模式(mode)
fl = open('d:\python.txt',encoding='utf-8',mode='r') #d:\python.txt是我d盤下的一個名為python的TXT文件,我寫這個文件時時用sublime軟體寫的,以utf-8編碼格式保存的,所以encoding參數是utf-8。
content = fl.read()
print(content)
fl.close #每次操作文件後一定要關閉
>>>i love python
open:內置函數,open底層調用的是操作系統的介面。
fl:變數,一般在文件操作時設置的約定俗成的變數,也有寫作為f1,fh,file_handler,f_h等,也被稱為文件句柄(但它只是一個約定俗成的變數,自己可以隨意更改,但最好不要改)。通過對文件進行的任何操作都需要用:文件句柄.(fl.raed()等)的方法。
encoding:可以不寫,不寫參數會以操作系統預設的編碼本打開(windows預設編碼:gbk(windows10是utf-8,Linux:utf-8,mac:utf-8),但最好寫上,記憶體中全是Unicode編碼,而記憶體中的文件則不是(詳細介紹請看python基礎學習day7)
mode:可以預設不寫,預設不寫則以只讀(r)的方式打開
常見報錯原因:
UnicodeDecodeError:文件儲存時與文件打開時編碼本不一致。
路徑分隔符產生問題: (反斜杠) 有轉義符的意思,如\n、\t、\u等,若果文件放在c盤中則有可能報錯。如下:
fl = open('C:\Users\a1566\Desktop\python.txt',encoding='utf-8',mode='r') content = fl.read() print(content) >>>SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape #解決方法:在文件路徑前加r,讓轉義符失效 fl = open(r'C:\Users\a1566\Desktop\python.txt',encoding='utf-8',mode='r') content = fl.read() print(content) >>>i love python
文件的讀取:
r , rb , r+, r+b.
read() 若括弧中無參數則一次全部讀出,若寫參數(數字)則可以按照字元(從1開始)讀取,文件中的換行符算作一個字元。
fl = open(r'd:\python.txt',encoding='utf-8',mode='r') content = fl.read() print(content) fl.close() >>>i love python content = fl.read(5) print(content) >>>i lov
readline() 若括弧中無參數則讀一行,若寫參數(數字)則可以按照字元(從1開始)讀取字元(同read),文件中的換行符算作一個字元。註意,文本中有換行符,而print()函數也預設換行。
fl = open(r'd:\python.txt',encoding='utf-8',mode='r') content = fl.readline() print(content) #可更改print的預設輸出結構以取消print函數預設輸出的換行符:print(content,end='') >>>i love python. #換行符也被讀出來了
readlines() 若括弧中無參數讀取所有行,返回列表,列表的每個元素為源文件的每一行,若寫參數(數字)則可以按照每一行讀取。
fl = open(r'd:\python.txt',encoding='utf-8',mode='r') content = fl.readlines() print(content,end='') fl.close() >>>['i love python.\n', 'i love you too.']
迴圈讀取,文件句柄可遍歷(文件句柄是一個迭代器,每次for迴圈時都只讀取文件一行,節省記憶體,而read,readlines等是一次讀取至記憶體中,若果文件過大,則會出現問題)。
f = open(r'd:\python.txt',encoding='utf-8') for line in f: print(line) f.close() >>>i love python. i love you too.
rb:操作的是非文本的文件,比如:圖片,視頻,音頻等。rb模式不用encoding
fl = open(r'd:\雪景.jpg',mode='rb') #雪景.jpg是張照片 print(fl.read()) >>> #位元組太多,請自測
r+ 讀寫功能(讀並追加),推薦先讀後寫
f = open(r'd:\python.txt',encoding='utf-8',mode='r+') f.read() f.write('1234567') #先讀後寫 f.close()
- 文件的讀取都有指針(游標)定位,文件中的指針起始位置在文件最前面。r+模式若先讀後寫,則寫入的內容會在文件末尾,若用先寫後讀,則會從文件開頭寫入,寫入一個字元就覆蓋一個字元,直到寫入完畢
- 先寫後讀會出現亂碼問題,因為中文,英文,特殊字元等所占的位元組不同,先寫後讀會以覆蓋式寫入,若寫入得字元串與文件中的字元串所占的位元組不同,則會出現亂碼和報錯。
文件的寫:
四種模式:w ,wb, w+, w+b
w,wb: 若已有相同的文件則會先清空原有文件的內容再寫入 ,若無則會創建。
- 清空:打開文件後會先清空原文件再寫入,但是如果文件句柄沒有關閉,則可以迴圈寫入而不會被清空。關閉文件句柄再次以’w‘模式打開原文件時才會清空
f = open('d:/text.txt',encoding='utf-8',mode='w') #可在當前目錄下創建有一個名為text的TXT類型的文件,若已有文件則會先清空文件內容再寫入 f.write('i love python') f.close()
文件的追加:
a ,ab ,a+ ,a+b
a:若無文件則會創建文件。若有則直接在原文件後追加
f = open('d:/text.txt',encoding='utf-8',mode='a') f.write('\ni love you too') f.close()
tell() 讀取指針(游標)的位子,以位元組為單位(utf-8編碼:一個中文三個位元組,一個字母1個位元組,詳情請看day2)
fl = open(r'd:\python.txt',encoding='utf-8') print(f1.tell()) >>>0 content = fl.read() print(fl.tell) >>>25 fl.close()
seek() 調整游標的位置,以位元組為單位
fl = open(r'd:\python.txt',encoding='utf-8') print(f1.seek(8))
flush() 強制刷新(保存),一般在寫文件時使用,在寫後一般要對文件句柄使用flush方法,以免保存失敗。
f = open(r'd:\text.txt',encoding='utf-8',mode='w') f.write('\ni love you too') f.flush() f.close()
打開文件的另一種方式(推薦)
- with open() as :
- 優點:不用手動關閉文件句柄,會在一定時間內關閉;一個with可以操作多個文件。
- 缺點:
with open(r'd:\text.txt',encoding='utf-8',mode='a') as f: f.write('\ni love you too') #打開多個文件: with open(r'd:\text.txt',encoding='utf-8',mode='a') as f1,open\(r'd:\python.txt',encoding='utf-8',mode='a') as f2: #第二個open後的反斜杠為換行符,換行符後不加任何字元,當一行的代碼太長時可以使用 f1.write('\ni love you too') f2.read()
- with open() as :
文件的修改操作:
各大操作文件的軟體(word、筆記本等等)底層都以以下基本方式操作文件:
- 1.以讀的模式打開原文件
- 2.以寫的模式創建一個新文件
- 3.將原文件的內容讀出來修改成新的內容,寫入新文件
- 4.將原文件刪除 (python需要引入os模塊)
- 5.將新文件重命名 (python需要引入os模塊)
實列方法(將d盤下的python.txt文件中的小寫o全變為大寫,python文件中的內容如下:i love python./n i love you too. 文件內容簡單,請自行創建即可)
import os #引入os模塊 #1.以讀的模式打開原文件 #2.以寫的模式創建一個新文件 with open(r'd:\python.txt',encoding='utf-8') as f1,\ open(r'd:\python.bak',encoding='utf-8',mode='w') as f2: #.bak是一種備份文件類型 #3.將原文件的內容讀出來修改成新的內容,寫入新文件 old_content = fl.read() #讀出來的為str類型 new_content = old_content.replace('o','O') f2.write(new_content) #4.將原文件刪除 os.remove('d:\python.txt') #5.將新文件重命名 os.rename('d:\python.bak','d:\python.txt')
以上方法(read)只能用於小文件,遇上大文件就會出現問題,因此可以對其進行更改,如下:
import os #引入os模塊 #1.以讀的模式打開原文件 #2.以寫的模式創建一個新文件 with open(r'd:\python.txt',encoding='utf-8') as f1,\ open(r'd:\python.bak',encoding='utf-8',mode='w') as f2: #.bak是一種備份文件類型 #3.將原文件的內容讀出來修改成新的內容,寫入新文件 for old_line in f1: new_line = old_line.replace('o','O') f2.write(new_line) #4.將原文件刪除 os.remove('d:\python.txt') #5.將新文件重命名 os.rename('d:\python.bak','d:\python.txt')