python常用標準庫(os系統模塊、shutil文件操作模塊)

来源:https://www.cnblogs.com/msr20666/archive/2022/06/04/16342292.html
-Advertisement-
Play Games

一、填空題 在種群增長預測問題中,若資源環境等因素是有限的,則應使用的微分方程模型為 Logistic模型 某種群分為 4 個年齡組, 各組的繁殖率分別為 0, 0.8, 1.8, 0.2, 存活率分別為 0.5, 0.7, 0.9, 0. 現各組的數量均為 100, 則該種群的的穩定分佈向量為 解 ...


常用的標準庫

系統模塊

import os

系統模塊用於對系統進行操作。

常用方法

os模塊的常用方法有數十種之多,本文中只選出最常用的幾種,其餘的還有許可權操作、文件的刪除創建等詳細資料可以參考官方文檔。

system -- 執行系統命令

參數的數據類型是字元串格式,內容是系統指令。執行時,直接返回系統輸出。

import os

os.system('ifconfig')  # Linux系統shell命令
os.system('ipconfig')  # Windows系統dos命令
popen -- 執行系統命令

在使用system執行系統命令的時候,發現在windows系統下執行命令時,中文字元發生了亂碼!這是因為windows為減少占用,對中文系統使用GB格式編碼,而python中預設使用的UTF-8編碼,編碼不相容導致了亂碼問題。

popen也可以執行系統指令,但是和system的工作方式不一樣。

popen執行系統指令之後返回對象,通過內置方法read讀出字元串,這個過程中read方法自動的將其它編碼轉換成為了UTF-8格式,所以popen相比system有更高的可讀性和相容性。

而在實際的使用過程中,發現popen不存在阻塞,即在執行一些長時間系統任務的時候,不會等待系統任務結束,python代碼就會繼續執行,在某些場景下會導致問題的出現。比如在我的一個場景中,要將一個文件夾中的文件刪除,之後在重寫一份文件,使用popen導致文件還沒有刪除,而代碼繼續執行使新文件已經寫好,而這個時候popen又將我新寫的文件刪除,導致我的程式在後續出現bug。所以,如果沒有可讀性的要求,我建議優先使用system方法。

import os

obj = os.popen('ipconfig')
res = obj.read()
print(res)
listdir -- 獲取指定文件夾中的所有文件

獲取指定文件夾中的所有文件(包括文件和文件夾),返迴文件的名稱,以列表的形式返回,預設情況為當前路徑。

import os

# 預設為當前路徑
files = os.listdir()
print(files)

# 相對和絕對路徑都可以使用
files = os.listdir('C:')
print(files)
walk -- 遞歸遍歷目錄

遞歸遍歷指定目錄,包括其所有的子目錄,返回一個迭代器對象。迭代器每次返回一個元組,元組為三個元素:

  1. 第一個元素為字元串,表示當前目錄路徑;
  2. 第二個元素為列表,表示當前目錄下的所有文件夾名(不包括子目錄中的);
  3. 第三個元素為列表,表示當前遍歷目錄中的所有文件名(不包括子目錄中的);
主要參數 含義
top 指定目錄;
topdown 正序遍歷還是倒序遍歷,預設為True(正序);

請看下例,目錄結構如下:

C:\USERS\MSR\DESKTOP\TEST
│root.txt
├─1
│  ├─1.txt
│  └─111
│     └─11.txt
└─2
   └─2.txt
import os

path = r'C:\Users\MSR\Desktop\test'

# 正序遍歷
res = os.walk(path)  # 返回迭代器
for i in res:
    print(i)
r"""
('C:\\Users\\MSR\\Desktop\\test', ['1', '2'], ['root.txt'])
('C:\\Users\\MSR\\Desktop\\test\\1', ['111'], ['1.txt'])
('C:\\Users\\MSR\\Desktop\\test\\1\\111', [], ['11.txt'])
('C:\\Users\\MSR\\Desktop\\test\\2', [], ['2.txt'])
"""

# 倒序遍歷(優先展示最深子目錄)
res = os.walk(path, topdown=False)
for i in res:
    print(i)
r"""
('C:\\Users\\MSR\\Desktop\\test\\1\\111', [], ['11.txt'])
('C:\\Users\\MSR\\Desktop\\test\\1', ['111'], ['1.txt'])
('C:\\Users\\MSR\\Desktop\\test\\2', [], ['2.txt'])
('C:\\Users\\MSR\\Desktop\\test', ['1', '2'], ['root.txt'])
"""
getcwd -- 獲取當前工作路徑
import os

# 獲取當前的工作路徑
dir_path = os.getcwd()
print(dir_path)  # E:\0-project\python\test

# 獲取當前文件的路徑
file_path = __file__  # 使用內置屬性__file__獲取
print(file_path)  # E:/0-project/python/test/test3.py

註意:getcwd()獲取的使用當前工作路徑,__file__是獲取當前文件的路徑

對於這個註意事項,大家一定要銘記於心,因為我被人欺騙了,當然這應該算是pycharm的坑吧!

註意了,文件的所在路徑和工作路徑是不相同的,文件的所在路徑就是在系統中的這個腳本文件實實在在的地址,如果這個文件在C:\下,那麼在任何的情況下這個文件的所在路徑都是C:\;而工作路徑不同,如果我們在C:\下執行這個python文件,那麼我們的工作路徑就是C:\,如果我們是在D:\下執行,那麼我們的工作路徑就是D:\,這就是文件所在地址和工作地址的區別,但是在一般情況下,我們執行文件都是在文件的所在地址執行的,所以大部分的時候文件所在路徑和當前工作路徑都是相同的。

可我在最開始學習這個方法的時候,我的老師教我說getcwd()的作用是獲取文件的所在路徑,那麼是什麼讓我一直以為getcwd()的作用是獲取文件的所在路徑呢?是老師教給我的……感覺這個老師很不靠譜?那麼老師怎麼沒有發現其中的含義呢?我怎麼又一直深信不疑呢?我覺得這個一定是要pycharm來背鍋了!我們在學習的時候一般都是相信自己的實際操作的結果的,我們執行的結果是什麼,反覆那麼幾次,我們的印象就會加深!

然後今天2021年12月7日20:58:09我在給公司的項目寫一個啟動腳本,目的是為了避免使用繁瑣的命令去啟動關閉項目,那麼我在寫的時候為了能夠在系統的任何一個地方都是可以使用這個腳本,所以將命令中的各種路徑全部寫為絕對路徑,我們系統工程師對絕對路徑是非常熟練的!但是在我寫好使用的時候就發現程式根本就啟動不起來,已啟動就死掉了,我就開始找原因,後來我發現在程式的目錄下啟動就沒有問題,在其它的地址啟動就有問題,我就意識到這是路徑的錯誤。當然我們是有日誌的,我看日誌說是配置文件相關的地方出現了錯誤,我一看,就很好奇,配置文件是在程式的目錄中的,讀取的時候使用相對路徑來獲取,但是卻沒有讀到文件,但是我檢查之後文件是存在的!那麼這個問題就很明顯了,工作路徑出了問題。

但是我還疑惑,為什麼會影響到相對路徑嗎?然後我就測試了getcwd,發現果然如此,getcwd返回的不是文件的所在地址而是當前所在的工作地址,這個時候我還不死心,因為當時老師說的不是這樣,所以我以為是linux和windows的差異,所以我就咋愛windows中又測試了一遍,發現還是一樣的。那麼我就又疑惑了,怎麼在pycharm中,工作路徑始終都是文件的所在路徑呢?然後我就發現原來pycharm中可以指定文件的工作路徑,而且預設將當前的文件路徑作為工作路徑使用。

在這裡插入圖片描述

然後我看文檔介紹:Return a unicode string representing the current working directory. ,emmm估計當時老師也是被pycharm坑了吧。所以大家以後如果想要在程式中固定工作路徑,可以在啟動文件中使用__file__獲取,或者使用os.chdir方法。

然後最後還是在強調一下:工作路徑會影響到相對路徑的使用,但是不會影響到sys.pathpython的環境變數。

chdir -- 修改當前工作路徑

之前我們有學過很多的函數,他們在涉及到路徑的時候,一般預設情況都是當前腳本文件所在的目錄(比如剛纔的listdirgetcwd),如果將文件的預設工作路徑修改,就會影響到其它的一些功能,比如說我們導入文件使用相對路徑等,所以,謹慎使用。

import os

# 在修改預設工作路徑前使用
print(os.getcwd())  # E:\0-project\python\test

# chdir 修改當前文件工作的預設路徑
os.chdir('C:')

# 在修改工作路徑後使用
print(os.getcwd())  # C:\
access -- 測試許可權

用於測試一個指定路徑或者文件的許可權,返回True或者False。

語法:os.access(path, mode)

必要參數為path和mode,分別表示路徑和測試的許可權類型。

mode 說明
os.F_OK 是否存在;
os.R_OK 是否可讀;
os.W_OK 是否可寫;
os.X_OK 是否可執行;
urandom -- 隨機位元組對象

返回包含適合加密使用的隨機位元組的bytes對象。

import os

# 參數為位元組長度
key = os.urandom(1)
print(key, len(key))
# b'\x92' 1

key = os.urandom(5)
print(key, len(key))
# b'\xde\x05/lh' 5
getpid&getppid -- 獲取進程和父進程

getpid用於返回當前程式(腳本文件)的進程ID,getppid用於返回當前程式(腳本文件)的父進程ID。

# 獲取進程唯一ID(PID)
import os

# getpid 返回當前進程的ID
print(os.getpid())  # 10784

# getppid 返回父進程的ID
# 如果父進程已退出,Windows電腦仍將運行返回其id;其他系統將返回“init”進程的id;
print(os.getppid())  # 16468
cpu_count -- 獲取CPU核心數(邏輯)
import os

print(os.cpu_count())

"""
結果:
8
"""

常用屬性

enciron -- 操作環境變數
import os

#  獲取系統的所有環境變數
ev_var = os.environ
print(ev_var)

# 獲取系統指定的環境變數
path_ev_var = os.environ['PATH']
print(path_ev_var)

# 添加環境變數
os.environ['PATH'] += r':/home/msr'  # Linux使用冒號分隔
os.environ['PATH'] += r';C:\Users\MSR'  # Windows使用分號分隔

# 其實可以看到,環境變數其實就是一個特殊的字典,修改環境變數就是在操作一個字典數據而已
name & sep & linesep
import os

# name 獲取系統標識(Linux ->posix   windows -> nt)
print(os.name)  # nt

# sep 獲取路徑分隔符號
print(os.sep)  # \

# linesep 獲取系統的換行符號
print(repr(os.linesep))  # '\r\n'

文件操作

mknod & remove -- 新建&刪除文件

windows系統不支持此方法。

import os

os.mknod('test.txt')
os.remove('test.txt')
mkdir & rmdir -- 創建&刪除文件夾
import os

os.mkdir('test_dir')
os.rmdir('test_dir')
rename -- 重命名文件或文件夾

語法:rename(old_path, new_path)

import os

os.rename('test.txt', 'hahaha.txt')
makedirs & removedirs -- 迭代創建&刪除文件夾
import os

# 迭代創建文件夾
os.makedirs('a/b/c/d/e')

# 迭代刪除文件夾(文件夾中存在文件,則該文件夾不刪除)
os.removedirs('a/b/c/d/e')

路徑模塊

import os.path

路徑模塊也是系統模塊中的一部分。

basename -- 返迴路徑中的文件名部分
import os.path

# 該路徑不一定真實存在
file_path = r'..\學習筆記\day1筆記.py'
file_name = os.path.basename(file_path)
print(file_name)  # day1筆記.py
dirname -- 返迴路徑中目錄部分
import os.path

file_path = r'..\學習筆記\day1筆記.py'
dir_path = os.path.dirname(file_path)
print(dir_path)  # ..\學習筆記
split -- 將目錄和文件名拆分成兩部分
import os.path

file_path = r'..\學習筆記\day1筆記.py'
tuple_var = os.path.split(file_path)
print(tuple_var)  # ('..\\學習筆記', 'day1筆記.py')
print(type(tuple_var))  # 返回元組: <class 'tuple'>
join -- 將多個路徑組合在一起
import os.path

path1 = 'abc'
path2 = '123'
path3 = 'main.py'

# 使用join組合
path = os.path.join(path1, path2, path3)
print(path)  # abc\123\main.py

# 也可以使用 os.sep
path = path1 + os.sep + path2 + os.sep + path3
print(path)  # abc\123\main.py
splitext -- 將文件名分為文件名和尾碼名
import os.path

# 分開文件名
file_name = 'main.py'
res = os.path.splitext(file_name)
print(res)  # ('main', '.py')
print(type(res))  # <class 'tuple'>

# 分來完整路徑
file_path = r'..\學習筆記\day1筆記.py'
res = os.path.splitext(file_path)
print(res)  # ('..\\學習筆記\\day1筆記', '.py')
print(type(res))  # <class 'tuple'>

# 也可以使用字元串內置方法 split 實現
res = file_path.split('.')
print(res)  # ['', '', '\\學習筆記\\day1筆記', 'py']
print(type(res))  # <class 'list'>
getsize -- 獲取指定文件的大小
import os.path

# 獲取指定文件的大小(單位:byte)
file_size_byte = os.path.getsize('test.txt')
getctime -- 獲取文件的創建時間

獲取文件的創建時間,返回時間戳。(windows有明確的創建時間,linux只有最後一次的修改時間。)

import os.path
import time

# 獲取文件創建時間
stamp_time = os.path.getctime('./test.py')
print(stamp_time)  # 1613989768.3445127

# 配合 時間模塊使用 獲取時間
print(time.ctime(stamp_time))  # Mon Feb 22 18:29:28 2021
getmtime -- 獲取文件的最後一次修改時間
import os.path
import time

# 獲取文件最後一次修改時間
stamp_time = os.path.getmtime('./test.py')
print(stamp_time)  # 1614037683.1067748

# 配合 時間模塊使用 獲取時間
print(time.ctime(stamp_time))  # Tue Feb 23 07:48:03 2021
getatime -- 獲取文件最後一次訪問時間
import os.path
import time

# 獲取文件最後一次訪問時間
stamp_time = os.path.getatime('./test.py')
print(stamp_time)  # 1635590737.799415

# 配合 時間模塊使用 獲取時間
print(time.ctime(stamp_time))  # Sat Oct 30 18:45:37 2021

不檢查路徑是否真實存在。

import os.path

# 檢查路徑類型,返回布爾值:
    # 不是對應類型或沒有相應文件 : False
    # 是對應類型:True

# isdir 檢查路徑是否是文件夾
res = os.path.isdir('test.txt')

# isfile 檢查路徑是否是文件
res = os.path.isfile('test.txt')

# islink 檢查路徑是否是鏈接
res = os.path.islink('test.txt')
isabs -- 檢查路徑是否是絕對路徑

不檢查路徑是否真實存在

import os.path

# 檢查windows路徑
path = r'E:\小黃片'
res = os.path.isabs(path)
print(res)  # True

# windows系統檢查Linux路徑
path = r'/root/home'
res = os.path.isabs(path)
print(res)  # True
abspath -- 相對路徑轉成絕對路徑

先檢查一個路徑是否是相對路徑,是則將其轉成絕對路徑,反之不變。

轉成絕對路徑的規則是:以當前的工作路徑為基準,根據相對路徑中的相對級別,將對應級別的工作路徑替換為原路徑中的相對路徑。

不檢查路徑是否真實存在。

import os.path

# 絕對路徑不改變
path = r'E:\學習資料'
new_path = os.path.abspath(path)
print(new_path)  # E:\學習資料

# 相對路徑轉成絕對路徑
path = r'..\學習資料'
new_path = os.path.abspath(path)
print(new_path)  # E:\0-project\python\學習資料

# 根據級別自動轉換
path = r'..\..\學習資料'
new_path = os.path.abspath(path)
print(new_path)  # E:\0-project\學習資料

# 如果相對的級別過多,就以根目錄為準(不會報錯)
path = r'..\..\..\..\..\..\..\..\..\..\學習資料'
new_path = os.path.abspath(path)
print(new_path)  # E:\學習資料
exists -- 檢查路徑是否真實存在

檢查路徑是否真實存在,返回布爾值。

import os.path

# 檢查指定路徑是否存在
path = r'E:\小黃片'
res = os.path.exists(path)
print(res)  # False

文件複製移動模塊(文件操作)

import shutil

用於對文件進行操作。

獲取文件信息,獲取文件信息,見系統模塊。

copyfileobj -- 複製文件(內容)

只複製文件的內容,通過文件IO操作,將一個文件的對象複製到另一個文件對象當中,因為需要在文件IO對象中操作,所以不推薦使用。

語法:copyfileobj(fsrc, fdst, length=16*1024)

copyfileobj(被覆制文件對象,新文件對象,一次性讀取字元數量。)

import shutil

with open('test.txt', 'r', encoding='UTF-8') as fp1 :
   with open('test2.txt', 'w', encoding='UTF-8') as fp2 :
      shutil.copyfileobj(fp1, fp2)
copyfile -- 複製文件(內容)

底層調用copyfileobj,使用方便快捷,所以推薦使用。

語法:copyfile(被覆制文件路徑, 新文件路徑)

import shutil

shutil.copyfile('test.txt', 'test2.txt')
copymode -- 複製文件(許可權)

僅複製文件的許可權,不複製文件的內容(被賦值許可權的文件必須存在),語法和copyfile相同。

import shutil

shutil.copymode('test.txt', 'test.txt')
copystat -- 複製文件(除了內容)

複製文件的所有的狀態信息,包括各種日期、許可權……就是沒有內容。

import shutil

shutil.copystat('test.txt', 'test.txt')
copy & copy2 -- 複製文件
import shutil

# 複製文件內容和許可權
shutil.copy('test.txt', 'test.txt')

# 完整複製整個文件(包括狀態、許可權、內容……)
shutil.copy2('test.txt', 'test.txt')
copytree -- 迭代複製文件夾中的所有
import shutil

shutil.copytree('../學習筆記', '../學習筆記備份')
rmtree -- 迭代刪除文件夾(即使文件夾中有文件)
import shutil

shutil.rmtree('..\小黃片')
move -- 移動文件或文件夾
import shutil

shutil.move('D:\學習資料', 'C:\我的心血')

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、游標概念 • 在 PL/SQL 塊執行 SELECT/INSERT/UPDATE/DELETE 語句時,Oracle 會在記憶體中為其分配上下文區,而游標是指向該區域的指針。 • 游標為應用程式提供了一種對具有多行數據查詢結果集中的每一行單獨處理的方案,是設計互動式應用程式的編程介面。 二、游標優 ...
  • 一、引言 • PL/SQL 程式可通過條件或迴圈結構來控制命令執行的流程。 • PL/SQL 提供了豐富的流程式控制制語句,與 Java 一樣也有三種控制結構: • 順序結構 • 選擇結構 • 迴圈結構 二、選擇結構 2.1、IF-THEN 1)IF-THEN 該結構先判斷一個條件是否為 TRUE,條件 ...
  • GPU 渲染機制:CPU計算好顯示內容提交到GPU,GPU渲染完成後將渲染結果放入幀緩衝區frame buffer,隨後視頻控制器會按照VSync信號逐行讀取幀緩衝區的數據,經過可能的數模轉換傳遞給顯示器顯示。 GPU 屏幕渲染有以下兩種方式: ● 1)On-Screen Rendering,意為當 ...
  • 非常感謝小趙同學給我反饋的這個 Bug
  • 前言 眾所周知,spring對於java程式員來說是一個及其重要的後端框架,幾乎所有的公司都會使用的框架,而且深受廣大面試官的青睞。所以本文就以常見的一個面試題"spring bean的生命周期"為切入點,從源碼的角度帶領大家來看一看 spring bean到底是如何創建的 。spring bean ...
  • springboot自動裝配原理探究 結論: SpringBoot啟動會載入大量的自動配置類 我們看我們需要的功能有沒有在SpringBoot預設寫好的自動配置類當中; 我們再來看這個自動配置類中到底配置了哪些組件;(只要我們要用的組件存在在其中,我們就不需要再手動配置了) 給容器中自動配置類添加組 ...
  • vscode 中配置Java環境 轉載說明:本篇文檔原作者[@火星動力猿],文檔出處來自嗶哩嗶哩-【教程】VScode中配置Java運行環境 轉載請在開頭或顯眼位置標註轉載信息。 1.下載VScode 官網地址:https://code.visualstudio.com/ (點鏈接時按下Ctrl,不 ...
  • SpringMVC 是基於 MVC 開發模式的框架,用來優化控制器,是 Spring 家族的一員,同時它也具備 IOC 和 AOP ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...