python 歷險記(三)— python 的常用文件操作

来源:https://www.cnblogs.com/reycg-blog/archive/2018/11/14/9951788.html
-Advertisement-
Play Games

[TOC] 前言 在 "上篇文章" 中,全面講解了 python 3 中 的面向對象,今天我會繼續探險,去掌握 python 3 中的文件操作, let's go 讓我們出發吧! 文件 什麼是文件? 一談到文件,就會涉及到一個的重要的概念, 持久化 。什麼是持久化? 持久化是將程式數據在 "持久" ...


目錄

前言

上篇文章 中,全面講解了 python 3 中 的面向對象,今天我會繼續探險,去掌握 python 3 中的文件操作, let's go 讓我們出發吧!

文件

什麼是文件?

一談到文件,就會涉及到一個的重要的概念,持久化 。什麼是持久化?

持久化是將程式數據在持久狀態和瞬時狀態間轉換的機制。通俗的講,就是瞬時數據(比如記憶體中的數據,是不能永久保存的)持久化為持久數據。 ——來源於百度百科

由此可見,持久化數據就是在程式運行結束後或者斷電後再開機,還繼續存在的數據。而文件就是最典型的表現形式。那什麼是文件呢?

文件就是存儲在如硬碟,光碟這樣的非易失媒介上的信息序列。像記憶體,在關機或掉電後,信息就全部丟失了,文件當然不會存儲在它上面。

當我們想要讀或者寫文件時,就得先打開(open) 文件才可以,而當讀寫完成的時候,也要儘量將其關閉(close),這樣才能夠釋放它占用的系統資源啊。

如何在 python 中打開文件?

使用內置函數 open 就可以打開文件。先來看下 python 中對 open 函數的定義

file object = open(file_name [, access_mode][, buffering])

參數定義如下

  • access_mode 表示文件模式。常見的模式有讀模式,寫模式,追加模式等。這個參數是可選的,如果不填,預設就是讀模式。具體的文件模式列表在下麵表格中列出。
  • buffering 緩存標誌
    • 如果不填,預設值為 0
    • 值為 1 表示行緩存
    • 值 > 1 則代表緩衝區的大小(單位是位元組)
    • 值 < 0 表示使用預設緩存區的大小
  • file_name 表示要訪問的文件路徑名稱,可以是相對路徑,也可以是絕對路徑。

具體的文件模式 access_mode 參數表如下

功能描述
w 寫模式
r 讀模式
x 寫模式,創建一個文件,如果文件已存在,則報錯
a 追加模式
b 二進位模式(可與其他模式結合使用)
+ 讀/寫模式(可與其他模式結合使用)

其中 b 或者 + 可與其他模式結合使用需要說明下:

  • rb 就表示讀取一個二進位文件
  • w+ 表示對打開的文件可讀可寫
  • wb+ 則表示對二進位文件可讀可寫,如果模式中不加 b則預設表示文本文件

調用 open 函數後返回的是什麼對象呢?能夠從這個對象中獲取什麼信息和執行什麼操作呢?來看下一節

python 文件對象有哪些屬性?

調用 open 函數後返回的是一個文件句柄,這個句柄中包含許多文件相關的屬性,具體如下麵表格所示

屬性 功能描述
file.closed 文件是否已關閉,是則返回 true
file.mode 打開文件時使用的模式
file.name 文件名稱

來看一個例子

f = open('test.py', 'r+')

# 文件名稱.
print ("File name: ", f.name) # test.py
# 文件是否已關閉
print ("File state: ", f.closed) # False
# 文件打開時的模式
print ("Opening mode: ", f.mode) # r+

打開文件後,最常見的操作就是讀文件和寫文件了,先來看讀文件

如何讀文件?

在讀取文件時, 最常用的方法就是 read()readlines() 兩個方法,在操作結束後都要調用 close() 方法關閉文件,釋放資源。

先來看 read() 方法

read()

打開文件後,

  • 調用 read(size) 方法可以一次讀取 size 位元組的數據

  • 如果read()方法中沒有參數可以一次將文件內容全部讀入到記憶體中

來看一個例子,假設有一個文件名稱為 a.txt 內容為

Good morning, everyone!
Good morning, my student!

先來讀取前 4 個字母

try:
  f = open('a.txt', 'r')
  print(f.read(4)) # Good
finally:
  if f:
    f.close()

上面代碼為什麼要用 try ... finally 包裹呢?

這是因為文件操作很可能出現 IO 異常的情況,需要使用 try ... finally 包住,即使出現異常也能保證 close() 方法能夠正常調用。

其實還有更簡潔的寫法,就是使用 with 語句,它就是一個語法糖,一下就把 try ... finally 的活都幹了。來感受下它的威力

with open('a.txt', 'r') as f:
  print(f.read(4)) # Good

readline()

對於文本文件來說,如果比較大,使用 readline() 方法則更為合理,可以一次讀取一行內容。

with open('a.txt', 'r') as f:
  print(f.readline()) # Good morning teacher!

如果一次想返回多列文本,可以使用 readlines() 方法,它會返回一個列表。

with open('a.txt', 'r') as f:
  print(f.readlines()) # ['Good morning teacher!\n', 'Good morning, my student!']

如何寫文件?

寫文件和讀文件操作非常類似,它們的區別就在於:

  • 調用 open 方法打開文件時,文件模式需要包含 wa或者 x

註意, 使用 w 模式打開文件後,執行寫入操作,如果文件已經存在,則會將之前的文件內容全部覆蓋,之前的數據內容就丟失了啊。如果不想覆蓋,還是使用 a 模式打開吧。

調用什麼方法可以寫文件呢? write()方法,調用成功後,會返回寫入文件的字元長度。

來看一個例子

with open('a.txt', 'w') as f:
  f.write('I am line 1\n')
  f.write('I am line 2\n')

上面代碼中,為什麼要加 \n 呢?這是用來分行的,要不然都擠在一行了。

註意,這裡如果不使用 with 語法糖,也一定要顯式的調用使用 close 方法。這不僅僅是因為釋放資源的原因:在調用 write() 方法時,操作系統不會立刻將數據寫入到文件中,而是先在記憶體中緩存,等到空閑時再寫入文件,最後使用 close() 方法才會將數據完整的寫入到文件中。

當然,顯式調用 flush() 方法也可以將數據立即寫入文件中。綜合比較,還是推薦使用 with 的方式,優雅且完善。

如何操作文件和目錄?

除了對文件讀和寫之外,還會經常用到如獲取文件路徑,查看文件大小,重命名,刪除文件等文件或目錄操作。這些操作應該調用哪些方法來完成呢?

強大的 os 模塊

剛開始接觸 os 模塊,就被它強大的 API 列表給震撼了,使用這個模塊幾乎可以完成所有的日常文件和目錄操作。為方便以後查詢,我專門將這些常用的操作分門別類,做了一個思維導圖。一起來看下。

os 模塊 API 思維導圖

上圖中只給出了最簡單的功能介紹,如果想要深入瞭解具體的方法使用,可參考 python 3.6 os 模塊官方地址

學習有時候就是這樣,API 太多根本記不住,也沒有必要完全記住,只要經常歸納整理,知道要使用的操作在什麼地方,叫什麼名字,用到的時候去查就可以了。

shutil 模塊— High-level file operations

除了 os 模塊,還有一個非常有用的模塊 shutil ,它的定位是針對多個文件的高級文件操作(High-level file operations)。相比而言, os 模塊大多是對單個文件而言的嘍。下麵通過幾個常用的操作來感受下:

  • 複製文件夾 shutil.copytree('olddir', 'newdir')
    • 註意, 參數olddir ,newdir 只能是目錄,而且 newdir 這個目錄不存在才可以
  • 移動文件或目錄 shutil.move('oldpath','newpath')
  • 刪除目錄 shutil.rmtree('dir')
    • 看上面的 os 思維導圖,也有一個刪除目錄 API os.rmdir(dir) ,只能刪除空目錄
    • shutil.rmtree 功能則更高級,無論是空還是非空目錄都可以刪除,確實是 High-level 啊 ^_^

對我來說,這三種常用的操作就可以了。當然 shutil 的功能遠比這些要豐富的多,有興趣的同學,可以到 官方文檔 去深入瞭解下。

小結

本篇主要介紹了 python 中文件常用的操作,內容包括打開文件,讀文件,寫文件,使用 osshutil 模塊來操作文件和目錄。下篇會介紹 jsonxml 處理,敬請期待。

相關文章列表


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • istio sidecar自動註入過程分析 sidecar自動註入檢查 istio通過 "mutating webhook admission controller" 機制實現sidecar的自動註入.istio sidecard在每個服務創建pod時都會被自動註入. 檢查kube apiserve ...
  • 系統架構設計師-需求 前言: 最近很久沒有發文章了。最近事情挺多的,也不知道該發那方面的內容。正好這兩天有空閑,就整理整理思緒,把一些總結髮表一下。 經過考慮後,先將軟考-架構相關的內容發出來,之後有時間,也會將一些額外的理論知識和經驗寫出來。 參考:《系統架構設計師考試全程指導》,《系統架構設計師 ...
  • 距離《 "重磅:Spring Boot 2.0 正式發佈!" 》已經過去大半年了,而 Spring Boot 2.1.0 在 10 月底就發佈了,我們來看下 Spring Boot 2.1.0 都更新了什麼,每一個 Java 技術人都值得關註。 棧長其實早就看到了更新了,現在才有時間來更新下。 1、 ...
  • 1、讀取cookies 2、將cookies保存在文件中 3、處理異常 URLError和HTTPError類,兩個類是父子關係,HTTPError會返回錯誤代碼,兩個類都可以處理request模塊產生的異常,這兩個都有一個reason屬性,用於記錄出現異常的原因 URLError處理異常: HTT ...
  • [TOC] 1.遷移 創建完模型類後,並沒有真正的在資料庫中創建了數據表,需要執行遷移命令,在數據表中創建數據表。 1.生成遷移文件 文件所在目錄執行命令 2.執行遷移命令 文件所在目錄執行命令 執行命令後到資料庫中查看是創建好了數據表。 添加測試數據 檢查資料庫中是否添加了數據。 ...
  • 我的博客: https://huangguangda.cn/ https://huangguangda.github.io/ 前言: 編碼解碼:編碼時將信息從一種形式變成為另一種形式,成為編碼.編碼為 ,逆過程為解碼.編碼時用代碼表示的,解碼為 ,有了編碼就有相關的編碼表,是對生活中的文件和電腦進 ...
  • 0.前言 最近老師佈置了一項用Java寫資源管理器的任務,一開始以為簡單,但是實際操作起來,卻發現網上的資源用起來相對生疏。在使用中,我也遇到了許多問題,雖然不能像其他博主一樣,寫的非常齊全,但我還是分享一下我寫的代碼。 1.準備知識 JTree是樹形結構,是我們做資源管理器的必要組件。其構造函數的 ...
  • 41.Iterator、ListIterator 和 Enumeration的區別? 迭代器是一種設計模式, 它是一個對象, 它可以遍歷並選擇序列中的對象, 而開發人員不需要瞭解 該序列的底層結構。 迭代器通常被稱為“輕量級”對象, 因為創建它的代價小。 Java中的Iterator功能比較簡單, ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...