Python3 文件操作(十六)

来源:http://www.cnblogs.com/jiyimeng/archive/2017/11/17/python11171.html
-Advertisement-
Play Games

一 文件操作 1.介紹 電腦系統分為:電腦硬體,操作系統,應用程式三部分。 我們用python或其他語言編寫的應用程式若想要把數據永久保存下來,必須要保存於硬碟中,這就涉及到應用程式要操作硬體,眾所周知,應用程式是無法直接操作硬體的,這就用到了操作系統。操作系統把複雜的硬體操作封裝成簡單的介面給 ...


一 文件操作

1.介紹

電腦系統分為:電腦硬體,操作系統,應用程式三部分。

我們用python或其他語言編寫的應用程式若想要把數據永久保存下來,必須要保存於硬碟中,這就涉及到應用程式要操作硬體,眾所周知,應用程式是無法直接操作硬體的,這就用到了操作系統。操作系統把複雜的硬體操作封裝成簡單的介面給用戶/應用程式使用,其中文件就是操作系統提供給應用程式來操作硬碟虛擬概念,用戶或應用程式通過操作文件,可以將自己的數據永久保存下來。

有了文件的概念,我們無需再去考慮操作硬碟的細節,只需要關註操作文件的流程:

#1. 打開文件,得到文件句柄並賦值給一個變數
#2. 通過句柄對文件進行操作
#3. 關閉文件

2. 在python中

1 #1. 打開文件,得到文件句柄並賦值給一個變數
2 f=open('a.txt','r',encoding='utf-8') #預設打開模式就為r
3 
4 #2. 通過句柄對文件進行操作
5 data=f.read()
6 
7 #3. 關閉文件
8 f.close()

3. f=open('a.txt','r')的過程分析

#1、由應用程式向操作系統發起系統調用open(...)

#2、操作系統打開該文件,並返回一個文件句柄給應用程式

#3、應用程式將文件句柄賦值給變數f

4. 強調!!!

#強調第一點:
打開一個文件包含兩部分資源:操作系統級打開的文件+應用程式的變數。在操作完畢一個文件時,必須把與該文件的這兩部分資源一個不落地回收,回收方法為:
1、f.close() #回收操作系統級打開的文件
2、del f #回收應用程式級的變數

其中del f一定要發生在f.close()之後,否則就會導致操作系統打開的文件還沒有關閉,白白占用資源,
而python自動的垃圾回收機制決定了我們無需考慮del f,這就要求我們,在操作完畢文件後,一定要記住f.close()

剛開始的時候很容易忘記f.close()方法去關閉,推薦傻瓜式操作方式:使用with關鍵字來幫我們管理上下文
with open('a.txt','w') as f:
    pass
 
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)
#強調第二點:
f=open(...)是由操作系統打開文件,那麼如果我們沒有為open指定編碼,那麼打開文件的預設編碼很明顯是操作系統說了算了,操作系統會用自己的預設編碼去打開文件,在windows下是gbk,在linux下是utf-8。
若要保證不亂碼,文件以什麼方式存的,就要以什麼方式打開。

f=open('a.txt','r',encoding='utf-8')

5. python2中的file與open

#首先在python3中操作文件只有一種選擇,那就是open()

#而在python2中則有兩種方式:file()與open()
兩者都能夠打開文件,對文件進行操作,也具有相似的用法和參數,但是,這兩種文件打開方式有本質的區別,file為文件類,用file()來打開文件,相當於這是在構造文件類,
而用open()打開文件,是用python的內建函數來操作,我們一般使用open()打開文件進行操作,而用file當做一個類型,比如type(f) is file

二 打開文件的模式

文件句柄 = open('文件路徑', '模式')

模式可以是以下方式以及他們之間的組合:

Character Meaning
‘r' open for reading (default)
‘w' open for writing, truncating the file first
‘a' open for writing, appending to the end of the file if it exists
‘b' binary mode
‘t' text mode (default)
‘+' open a disk file for updating (reading and writing)
‘U' universal newline mode (for backwards compatibility; should not be used in new code)

 

#1. 打開文件的模式有(預設為文本模式):
r ,只讀模式【預設模式,文件必須存在,不存在則拋出異常】
w,只寫模式【不可讀;不存在則創建;存在則清空內容】
a, 之追加寫模式【不可讀;不存在則創建;存在則只追加內容】

#2. 對於非文本文件,我們只能使用b模式,"b"表示以位元組的方式操作(而所有文件也都是以位元組的形式存儲的,使用這種模式無需考慮文本文件的字元編碼、圖片文件的jgp格式、視頻文件的avi格式)
rb 
wb
ab
註:以b方式打開時,讀取到的內容是位元組類型,寫入時也需要提供位元組類型,不能指定編碼

#3. 瞭解部分
"+" 表示可以同時讀寫某個文件
r+, 讀寫【可讀,可寫】
w+,寫讀【可讀,可寫】
a+, 寫讀【可讀,可寫】


x, 只寫模式【不可讀;不存在則創建,存在則報錯】
x+ ,寫讀【可讀,可寫】
xb

三 操作文件的方法

 1 #掌握
 2 f.read() #讀取所有內容,游標移動到文件末尾
 3 f.readline() #讀取一行內容,游標移動到第二行首部
 4 f.readlines() #讀取每一行內容,存放於列表中
 5 
 6 f.write('1111\n222\n') #針對文本模式的寫,需要自己寫換行符
 7 f.write('1111\n222\n'.encode('utf-8')) #針對b模式的寫,需要自己寫換行符
 8 f.writelines(['333\n','444\n']) #文件模式
 9 f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式
10 
11 #瞭解
12 f.readable() #文件是否可讀
13 f.writable() #文件是否可讀
14 f.closed #文件是否關閉
15 f.encoding #如果文件打開模式為b,則沒有該屬性
16 f.flush() #立刻將文件內容從記憶體刷到硬碟
17 f.name

四 文件內游標移動

1: read(3):

  (1. 文件打開方式為文本模式時,代表讀取3個字元

  (2. 文件打開方式為b模式時,代表讀取3個位元組

2: 其餘的文件內游標移動都是以位元組為單位如seek,tell,truncate

註意:

  1. seek有三種移動方式0,1,2,其中1和2必須在b模式下進行,但無論哪種模式,都是以bytes為單位移動的

  2. truncate是截斷文件,所以文件的打開方式必須可寫,但是不能用w或w+等方式打開,因為那樣直接清空文件了,所以truncate要在r+或a或a+等模式下測試效果

 1 import time
 2 with open('test.txt','rb') as f:
 3     f.seek(0,2)
 4     while True:
 5         line=f.readline()
 6         if line:
 7             print(line.decode('utf-8'))
 8         else:
 9             time.sleep(0.2)
10 
11 練習:基於seek實現tail -f功能

五 文件的修改

 文件的數據是存放於硬碟上的,因而只存在覆蓋、不存在修改這麼一說,我們平時看到的修改文件,都是模擬出來的效果,具體的說有兩種實現方式:

方式一:將硬碟存放的該文件的內容全部載入到記憶體,在記憶體中是可以修改的,修改完畢後,再由記憶體覆蓋到硬碟(word,vim,nodpad++等編輯器)

1 with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
2     data=read_f.read() #全部讀入記憶體,如果文件很大,會很卡
3     data=data.replace('alex','SB') #在記憶體中完成修改
4 
5     write_f.write(data) #一次性寫入新文件
6 
7 os.remove('a.txt')
8 os.rename('.a.txt.swap','a.txt') 

 方式二:將硬碟存放的該文件的內容一行一行地讀入記憶體,修改完畢就寫入新文件,最後用新文件覆蓋源文件

import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    for line in read_f:
        line=line.replace('alex','SB')
        write_f.write(line)

os.remove('a.txt')
os.rename('.a.txt.swap','a.txt') 

 六 file對象常用的函數

序號方法及描述
1

file.close()

關閉文件。關閉後文件不能再進行讀寫操作。

2

file.flush()

刷新文件內部緩衝,直接把內部緩衝區的數據立刻寫入文件, 而不是被動的等待輸出緩衝區寫入。

3

file.fileno()

返回一個整型的文件描述符(file descriptor FD 整型), 可以用在如os模塊的read方法等一些底層操作上。

4

file.isatty()

如果文件連接到一個終端設備返回 True,否則返回 False。

5

file.next()

返迴文件下一行。

6

file.read([size])

從文件讀取指定的位元組數,如果未給定或為負則讀取所有。

7

file.readline([size])

讀取整行,包括 "\n" 字元。

8

file.readlines([sizeint])

讀取所有行並返回列表,若給定sizeint>0,返回總和大約為sizeint位元組的行, 實際讀取值可能比 sizeint 較大, 因為需要填充緩衝區。

9

file.seek(offset[, whence])

設置文件當前位置

10

file.tell()

返迴文件當前位置。

11

file.truncate([size])

從文件的首行首字元開始截斷,截斷文件為 size 個字元,無 size 表示從當前位置截斷;截斷之後 V 後面的所有字元被刪除,其中 Widnows 系統下的換行代表2個字元大小。

12

file.write(str)

將字元串寫入文件,沒有返回值。

13

file.writelines(sequence)

向文件寫入一個序列字元串列表,如果需要換行則要自己加入每行的換行符。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 首先出個題: 如圖: 假設對成長速度顯示規定如下: 成長速度為5顯示1個箭頭; 成長速度為10顯示2個箭頭; 成長速度為12顯示3個箭頭; 成長速度為15顯示4個箭頭; 其他都顯示都顯示0各箭頭。 用代碼怎麼實現? 差一點的if,else: Js代碼 var add_level = 0; if(ad ...
  • 背水一戰 Windows 10 之 控制項(控制項基類 - UIElement ): 拖放的基本應用, 手動開啟 UIElement 的拖放操作 ...
  • 在我們開發工作流模塊的時候,有時候填寫申請單過程中,暫時不想提交審批,那麼可以暫存為草稿,以供下次繼續填寫或者提交處理,那麼這個草稿的功能是比較實用的,否則對於一些填寫內容比較多的申請單,每次要重填寫很多數據,那會被用戶罵的,從用戶的角度上來講,提供草稿保存的功能是比較友好的。本篇隨筆介紹在工作流模... ...
  • 簡介 排序演算法是我們編程中遇到的最多的演算法。目前主流的演算法有8種。 平均時間複雜度從高到低依次是: 冒泡排序(o(n2)),選擇排序(o(n2)),插入排序(o(n2)),堆排序(o(nlogn)), 歸併排序(o(nlogn)),快速排序(o(nlogn)), 希爾排序(o(n1.25)),基數排 ...
  • 結構體List則表示鏈表這種數據結構(見示例1)。這個結構由5個成員組成:size表示鏈表中元素個數;match並不由鏈表本身使用,而是由鏈表數據結構派生而來的新類型所使用;destroy是封裝之後傳遞給list_init的析構函數;head是指向鏈表中頭結點元素的指針;tail則是指向鏈表中末尾結... ...
  • 一.電腦硬體介紹 概念:由一條匯流排把CPU、記憶體和I/O設備串聯起來並與其他設備進行通信。 CPU負責運算,記憶體用於儲存臨時變數,硬碟用於儲存數據 應用程式、操作系統及硬體的關係:參考應用程式的啟動流程 1. 處理器CPU( 寄存器+控制器 ) 取指令 解碼 執行 ,直到程式結束。 1. 通用寄存 ...
  • #00 在python裡面沒有常量,只有變數 #01刪除變數:del 變數名 #02coding:utf-8 //設置utf-8編碼 #03 單行註釋:#多行註釋:三個任意符號,一般用'''#04 table鍵和四個空格不相等,縮進要保持一致 我的IDLE中預設按tab鍵就是四個空格 ...
  • 前言 接手前輩的項目,沒有接觸、安裝、使用過perl和DBD::Oracle,也沒有相關的文檔記錄,茫茫然不知所措~~。一開始發現這個問題,就想著迅速解決,就直接在google上搜報錯信息,搜索的過程中發現 如果不搞清楚前因後果我連解決方案都‘看不見’‘看不懂’。 所以還是要補充這方面的知識,再思考 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...