Python re模塊 subprocess模塊

来源:https://www.cnblogs.com/hades0607/archive/2018/08/14/9478364.html
-Advertisement-
Play Games

'''re模塊 內部實現不是Python 而是調用了c的庫 re是什麼 正則 表達 式子 就是一些帶有特殊含義的符號或者符號的組合 作用: 對字元串進行過濾 在一對字元串中找到所關心的內容 你就需要告訴電腦過濾規則是什麼樣 通過什麼方式來告訴電腦 就通過正則表達式 re模塊常用方法findall ...


'''
re模塊 內部實現不是Python 而是調用了c的庫
re是什麼
正則 表達 式子
就是一些帶有特殊含義的符號或者符號的組合
作用: 對字元串進行過濾
在一對字元串中找到所關心的內容
你就需要告訴電腦過濾規則是什麼樣
通過什麼方式來告訴電腦 就通過正則表達式
re模塊常用方法
findall 從左往右查找所有滿足條件的字元 返回一個列表
search 返回第一個匹配的字元串 結果封裝為對象 span=(0,5)匹配的位置 match匹配的值
match 匹配行首 返回值與search相同
對於search match 匹配的結果通過group來獲取
compile 將正則表達式封裝為一個正則對象 好處是可以重覆使用這個表達式

第一步:
學習正則表達式 各種符號所表示的含義
各種符號
常用的
\w \s \d . ^ $
範圍匹配
[] a|b
重覆匹配
{} + * ?
分組
()
常用的方法:
findall
search
match
sub
split

2.subprocess
run 返回執行結果對象
call 返回執行狀態碼
Popen 返回的也是對象 out in err

進程間的數據訪問

'''
import re

#待處理字元串
# src = 'hades'
#在字元串中查找所有滿足條件的
# print(re.findall('ad',src))

# \w 字母數字下劃線
# \W 非字母數字下劃線 與\w相反
# print(re.findall('\w',src))
# print(re.findall('\W',src))

# \s 所有不可見字元
# \S 所有可見字元
# print(re.findall('\s',src))
# print(re.findall('\S',src))

# \d 所有數字可見
# \D 所有非數字可見
# print(re.findall('\d',src))
# print(re.findall('\D',src))

# 特殊字元直接匹配
# print(re.findall('\n',src))
# print(re.findall('\t',src))

# . 除了\n以外任意字元
# print(re.findall('.',src))

# \s \w \d . 都是匹配單個字元
#匹配重覆字元 * + ? {}

# * 前面的表達式出現任意次
# print(re.findall('\d*','1 12 aa'))

# + 重覆1次或多次
# print(re.findall('\d+','1 1221abc41515a aa'))

# ? 重覆0次或1次
# print(re.findall('\d?','aa bb a1c 1C1 哈哈哈 123'))

# {n,m} 最少n次 最多m次
# print(re.findall('\d{1,3}','1 12 123 1234 123456'))

# {n} 必須是n次
# print(re.findall('[a-z]{3}','a aa aaa aaaa aaaaa'))

# {,m} 最大m次 0-m
# print(re.findall('[a-z]{,3}','a aa aaa aaaa aaaaa'))


#匹配範圍
# | 0|1|2 或
# print(re.findall('0|1|2','12413sdfg'))

# [] 字元集合 括弧內的符號不是整體
# print(re.findall('[012]','1982asasa'))

# 在範圍匹配時使用 ^ 托字元表示取反
# print(re.findall('[^0-9]','1982asasa'))

#找出範圍內 數字0-9 字母a-z A-Z 註意(減號只有在兩個字元中間才代表範圍,在兩邊都是普通字元)
# print(re.findall('[0-9a-zA-Z]','1982+asasa'))

# ^ 匹配行首
# print(re.findall('^h','helhhlohh'))

# $ 匹配行尾 註意:寫在表達式後面
# print(re.findall('s$','helhhlohs'))

# 單詞邊界
# print(re.findall('o\\b','hello word hi hades'))

#雙斜杠?
# print(re.findall('a\\\\c','aakakja\c'))

#貪婪匹配 * + 註意: 不是固定寫法 是一種現象
#會一直匹配到不滿足條件為止 用問號來阻止貪婪匹配(匹配最少滿足條件的字元數)
# print(re.findall('\w+? ','dfgregersg'))
# print(re.findall('\w*? ','dfgregersg'))

# () 用於給正則表達式分組(group)
#什麼時候需要阻止貪婪
# src = '<img src="www.baidupic.shuaiqi.jpg"><img src="www.baidupic.shuaiqi.jpg"><img src="www.baidupic.shuaiqi.jpg">'
#請用正則表達式取圖片地址
# print(re.findall('src="(.+?)"',src))
# 瞭解 加上?: 可以取消括弧中的優先順序
# print(re.findall('src="(?:.+?)"',src))


subprocess模塊
sub 子
process 進程
什麼是進程
正在進行中的程式 每當打開一個程式就會開啟一個進程
每個進程包含運行程式所需的所有資源
正常情況下,不可以跨進程訪問數據
但是有些情況下就是需要訪問別的進程數據 提供一個叫做管道的對象 專門用於跨進程通訊

作用: 用於執行系統命令

常用方法:
run 返回一個表示執行結果的對象
call 返回的執行的狀態碼
總結: subprocess的好處是可以獲取指令的執行結果
subprocess執行指令時,可以在子進程中這樣

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 給定一個二叉樹,找出其最大深度。 二叉樹的深度為根節點到最遠葉子節點的最長路徑上的節點數。 說明: 葉子節點是指沒有子節點的節點。 示例: 給定二叉樹 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7 返回它的最大深度 3 。 /** * Definition ...
  • 1.單例模式的定義 單例模式確保某個類只有一個實例,而且自行實例化並向整個系統提供這個實例。 2.單例模式的特點 單例類只能有一個實例。 單例類必須自己創建自己的唯一實例。 單例類必須給所有其他對象提供這一實例。 3.單例模式的Java代碼 單例模式分為懶漢式(需要才去創建對象)和餓漢式(創建類的實 ...
  • 平臺:mac 網站:人人網 最近練習爬蟲登陸,方法一是找頁面里的js文件,通過解析js文件找到cookie信息再保持。但現在的站點登陸都有驗證碼,而且最煩的是request時data表單里的值基本上沒有不加密的,js學的不好,就別想著破解了。所以想起了用的比較少的selenium模塊,用於模擬登陸並 ...
  • 及最近部署TP5遇到了很多坑,各種環境下都會出現一些問題,下麵是我記錄的排坑之路 先說最簡單的lnmp一鍵安裝包,我用的是1.5穩定版 安裝命令:wget http://soft.vpser.net/lnmp/lnmp1.5.tar.gz -cO lnmp1.5.tar.gz && tar zxf ...
  • 說起來做一個支付系統最基礎的就是支付功能了,對於我們來說除了各大銀行以外微信和支付寶也是必選項,畢竟人家這個龐大的用戶群在那裡擺著呢,你不用那不是想著放棄這些用戶麽。 今天我們就來看一看對於我們開發者來說如何快速的進行接入。 首先我們要做的就是先去螞蟻金服開放平臺註冊賬號https://open.a ...
  • 這篇文章主要介紹了Python異常處理總結,需要的朋友可以參考下本文較為詳細的羅列了Python常見的異常處理,供大家參考,具體如下: 1.入門讀物 2.進階讀物 3.Web框架 4.爬蟲開發 5.圖形圖像6.數據分析 7.機器學習等等資料!需要的可以加QQ群:832339352!進群免費獲取! 拋 ...
  • Description George took sticks of the same length and cut them randomly until all parts became at most 50 units long. Now he wants to return sticks to ...
  • 1、Java支持基於流的通信和基於包的通信 基於流的通信使用TCP協議(傳輸控制協議)進行數據傳輸,傳輸是無損可靠的 基於包的通信使用UDP協議(用戶數據報協議)進行數據傳輸,不能保證傳輸沒有丟失 2、服務端和客戶端套接字--基於流的通信 客戶端代碼 如果服務端的埠服務沒有起來,運行客戶端的程式會 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...