一 文件操作 1.介紹 電腦系統分為:電腦硬體,操作系統,應用程式三部分。 我們用python或其他語言編寫的應用程式若想要把數據永久保存下來,必須要保存於硬碟中,這就涉及到應用程式要操作硬體,眾所周知,應用程式是無法直接操作硬體的,這就用到了操作系統。操作系統把複雜的硬體操作封裝成簡單的介面給 ...
一 文件操作
1.介紹
電腦系統分為:電腦硬體,操作系統,應用程式三部分。
我們用python或其他語言編寫的應用程式若想要把數據永久保存下來,必須要保存於硬碟中,這就涉及到應用程式要操作硬體,眾所周知,應用程式是無法直接操作硬體的,這就用到了操作系統。操作系統把複雜的硬體操作封裝成簡單的介面給用戶/應用程式使用,其中文件就是操作系統提供給應用程式來操作硬碟虛擬概念,用戶或應用程式通過操作文件,可以將自己的數據永久保存下來。
有了文件的概念,我們無需再去考慮操作硬碟的細節,只需要關註操作文件的流程:
#1. 打開文件,得到文件句柄並賦值給一個變數 #2. 通過句柄對文件進行操作 #3. 關閉文件
2. 在python中
1 #1. 打開文件,得到文件句柄並賦值給一個變數 2 f=open('a.txt','r',encoding='utf-8') #預設打開模式就為r 3 4 #2. 通過句柄對文件進行操作 5 data=f.read() 6 7 #3. 關閉文件 8 f.close()
3. f=open('a.txt','r')的過程分析
#1、由應用程式向操作系統發起系統調用open(...) #2、操作系統打開該文件,並返回一個文件句柄給應用程式 #3、應用程式將文件句柄賦值給變數f
4. 強調!!!
#強調第一點: 打開一個文件包含兩部分資源:操作系統級打開的文件+應用程式的變數。在操作完畢一個文件時,必須把與該文件的這兩部分資源一個不落地回收,回收方法為: 1、f.close() #回收操作系統級打開的文件 2、del f #回收應用程式級的變數 其中del f一定要發生在f.close()之後,否則就會導致操作系統打開的文件還沒有關閉,白白占用資源, 而python自動的垃圾回收機制決定了我們無需考慮del f,這就要求我們,在操作完畢文件後,一定要記住f.close() 剛開始的時候很容易忘記f.close()方法去關閉,推薦傻瓜式操作方式:使用with關鍵字來幫我們管理上下文 with open('a.txt','w') as f: pass with open('a.txt','r') as read_f,open('b.txt','w') as write_f: data=read_f.read() write_f.write(data)
#強調第二點: f=open(...)是由操作系統打開文件,那麼如果我們沒有為open指定編碼,那麼打開文件的預設編碼很明顯是操作系統說了算了,操作系統會用自己的預設編碼去打開文件,在windows下是gbk,在linux下是utf-8。 若要保證不亂碼,文件以什麼方式存的,就要以什麼方式打開。 f=open('a.txt','r',encoding='utf-8')
5. python2中的file與open
#首先在python3中操作文件只有一種選擇,那就是open() #而在python2中則有兩種方式:file()與open() 兩者都能夠打開文件,對文件進行操作,也具有相似的用法和參數,但是,這兩種文件打開方式有本質的區別,file為文件類,用file()來打開文件,相當於這是在構造文件類,
而用open()打開文件,是用python的內建函數來操作,我們一般使用open()打開文件進行操作,而用file當做一個類型,比如type(f) is file
二 打開文件的模式
文件句柄 = open('文件路徑', '模式')
模式可以是以下方式以及他們之間的組合:
Character | Meaning |
‘r' | open for reading (default) |
‘w' | open for writing, truncating the file first |
‘a' | open for writing, appending to the end of the file if it exists |
‘b' | binary mode |
‘t' | text mode (default) |
‘+' | open a disk file for updating (reading and writing) |
‘U' | universal newline mode (for backwards compatibility; should not be used in new code) |
#1. 打開文件的模式有(預設為文本模式): r ,只讀模式【預設模式,文件必須存在,不存在則拋出異常】 w,只寫模式【不可讀;不存在則創建;存在則清空內容】 a, 之追加寫模式【不可讀;不存在則創建;存在則只追加內容】 #2. 對於非文本文件,我們只能使用b模式,"b"表示以位元組的方式操作(而所有文件也都是以位元組的形式存儲的,使用這種模式無需考慮文本文件的字元編碼、圖片文件的jgp格式、視頻文件的avi格式) rb wb ab 註:以b方式打開時,讀取到的內容是位元組類型,寫入時也需要提供位元組類型,不能指定編碼 #3. 瞭解部分 "+" 表示可以同時讀寫某個文件 r+, 讀寫【可讀,可寫】 w+,寫讀【可讀,可寫】 a+, 寫讀【可讀,可寫】 x, 只寫模式【不可讀;不存在則創建,存在則報錯】 x+ ,寫讀【可讀,可寫】 xb
三 操作文件的方法
1 #掌握 2 f.read() #讀取所有內容,游標移動到文件末尾 3 f.readline() #讀取一行內容,游標移動到第二行首部 4 f.readlines() #讀取每一行內容,存放於列表中 5 6 f.write('1111\n222\n') #針對文本模式的寫,需要自己寫換行符 7 f.write('1111\n222\n'.encode('utf-8')) #針對b模式的寫,需要自己寫換行符 8 f.writelines(['333\n','444\n']) #文件模式 9 f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式 10 11 #瞭解 12 f.readable() #文件是否可讀 13 f.writable() #文件是否可讀 14 f.closed #文件是否關閉 15 f.encoding #如果文件打開模式為b,則沒有該屬性 16 f.flush() #立刻將文件內容從記憶體刷到硬碟 17 f.name
四 文件內游標移動
1: read(3):
(1. 文件打開方式為文本模式時,代表讀取3個字元
(2. 文件打開方式為b模式時,代表讀取3個位元組
2: 其餘的文件內游標移動都是以位元組為單位如seek,tell,truncate
註意:
1. seek有三種移動方式0,1,2,其中1和2必須在b模式下進行,但無論哪種模式,都是以bytes為單位移動的
2. truncate是截斷文件,所以文件的打開方式必須可寫,但是不能用w或w+等方式打開,因為那樣直接清空文件了,所以truncate要在r+或a或a+等模式下測試效果
1 import time 2 with open('test.txt','rb') as f: 3 f.seek(0,2) 4 while True: 5 line=f.readline() 6 if line: 7 print(line.decode('utf-8')) 8 else: 9 time.sleep(0.2) 10 11 練習:基於seek實現tail -f功能
五 文件的修改
文件的數據是存放於硬碟上的,因而只存在覆蓋、不存在修改這麼一說,我們平時看到的修改文件,都是模擬出來的效果,具體的說有兩種實現方式:
方式一:將硬碟存放的該文件的內容全部載入到記憶體,在記憶體中是可以修改的,修改完畢後,再由記憶體覆蓋到硬碟(word,vim,nodpad++等編輯器)
1 with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f: 2 data=read_f.read() #全部讀入記憶體,如果文件很大,會很卡 3 data=data.replace('alex','SB') #在記憶體中完成修改 4 5 write_f.write(data) #一次性寫入新文件 6 7 os.remove('a.txt') 8 os.rename('.a.txt.swap','a.txt')
方式二:將硬碟存放的該文件的內容一行一行地讀入記憶體,修改完畢就寫入新文件,最後用新文件覆蓋源文件
import os with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f: for line in read_f: line=line.replace('alex','SB') write_f.write(line) os.remove('a.txt') os.rename('.a.txt.swap','a.txt')
六 file對象常用的函數
序號 | 方法及描述 |
---|---|
1 |
關閉文件。關閉後文件不能再進行讀寫操作。 |
2 |
刷新文件內部緩衝,直接把內部緩衝區的數據立刻寫入文件, 而不是被動的等待輸出緩衝區寫入。 |
3 |
返回一個整型的文件描述符(file descriptor FD 整型), 可以用在如os模塊的read方法等一些底層操作上。 |
4 |
如果文件連接到一個終端設備返回 True,否則返回 False。 |
5 |
返迴文件下一行。 |
6 |
從文件讀取指定的位元組數,如果未給定或為負則讀取所有。 |
7 |
讀取整行,包括 "\n" 字元。 |
8 |
讀取所有行並返回列表,若給定sizeint>0,返回總和大約為sizeint位元組的行, 實際讀取值可能比 sizeint 較大, 因為需要填充緩衝區。 |
9 |
設置文件當前位置 |
10 |
返迴文件當前位置。 |
11 |
從文件的首行首字元開始截斷,截斷文件為 size 個字元,無 size 表示從當前位置截斷;截斷之後 V 後面的所有字元被刪除,其中 Widnows 系統下的換行代表2個字元大小。 |
12 |
將字元串寫入文件,沒有返回值。 |
13 |
向文件寫入一個序列字元串列表,如果需要換行則要自己加入每行的換行符。 |