python的OS庫和正則表達式庫

来源:http://www.cnblogs.com/xk-bench/archive/2017/11/05/7786667.html
-Advertisement-
Play Games

摘自:http://blog.chinaunix.net/uid-16360955-id-3351990.html 作留存學習 1.常用內置函數:(不用import就可以直接使用) help(obj) 線上幫助, obj可是任何類型 callable(obj) 查看一個obj是不是可以像函數一樣調用 ...


摘自:http://blog.chinaunix.net/uid-16360955-id-3351990.html 作留存學習

1.常用內置函數:(不用import就可以直接使用)  

    help(obj) 線上幫助, obj可是任何類型 
    callable(obj) 查看一個obj是不是可以像函數一樣調用 
    repr(obj) 得到obj的表示字元串,可以利用這個字元串eval重建該對象的一個拷貝 
    eval_r(str) 表示合法的python表達式,返回這個表達式 
    dir(obj) 查看obj的name space中可見的name 
    hasattr(obj,name) 查看一個obj的name space中是否有name 
    getattr(obj,name) 得到一個obj的name space中的一個name 
    setattr(obj,name,value) 為一個obj的name space中的一個name指向vale這個object 
    delattr(obj,name) 從obj的name space中刪除一個name 
    vars(obj) 返回一個object的name space。用dictionary表示 
    locals() 返回一個局部name space,用dictionary表示 
    globals() 返回一個全局name space,用dictionary表示 
    type(obj) 查看一個obj的類型 
    isinstance(obj,cls) 查看obj是不是cls的instance 
    issubclass(subcls,supcls) 查看subcls是不是supcls的子類 
    
  類型轉換函數 
    chr(i) 把一個ASCII數值,變成字元 
    ord(i) 把一個字元或者unicode字元,變成ASCII數值 
    oct(x) 把整數x變成八進位表示的字元串 
    hex(x) 把整數x變成十六進位表示的字元串 
    str(obj) 得到obj的字元串描述 
    list(seq) 把一個sequence轉換成一個list 
    tuple(seq) 把一個sequence轉換成一個tuple 
    dict(),dict(list) 轉換成一個dictionary 
    int(x) 轉換成一個integer 
    long(x) 轉換成一個long interger 
    float(x) 轉換成一個浮點數 
    complex(x) 轉換成複數 
    max(...) 求最大值 
    min(...) 求最小值 
  用於執行程式的內置函數 
    complie 如果一段代碼經常要使用,那麼先編譯,再運行會更快。 
    
2.和操作系統相關的調用 
  系統相關的信息模塊 import sys 
    sys.argv是一個list,包含所有的命令行參數. 
    sys.stdout sys.stdin sys.stderr 分別表示標準輸入輸出,錯誤輸出的文件對象. 
    sys.stdin.readline() 從標準輸入讀一行 sys.stdout.write("a") 屏幕輸出a 
    sys.exit(exit_code) 退出程式 
    sys.modules 是一個dictionary,表示系統中所有可用的module 
    sys.platform 得到運行的操作系統環境 
    sys.path 是一個list,指明所有查找module,package的路徑. 
    
  操作系統相關的調用和操作 import os 
    os.environ 一個dictionary 包含環境變數的映射關係 os.environ["HOME"] 可以得到環境變數HOME的值 
    os.chdir(dir) 改變當前目錄 os.chdir('d:\\outlook') 註意windows下用到轉義 
    os.getcwd() 得到當前目錄 
    os.getegid() 得到有效組id  os.getgid() 得到組id 
    os.getuid() 得到用戶id  os.geteuid() 得到有效用戶id 
    os.setegid os.setegid() os.seteuid() os.setuid() 
    os.getgruops() 得到用戶組名稱列表 
    os.getlogin() 得到用戶登錄名稱 
    os.getenv 得到環境變數 
    os.putenv 設置環境變數 
    os.umask 設置umask 
    os.system(cmd) 利用系統調用,運行cmd命令 
    操作舉例: 
      os.mkdir('/tmp/xx') os.system("echo 'hello' > /tmp/xx/a.txt") os.listdir('/tmp/xx') 
      os.rename('/tmp/xx/a.txt','/tmp/xx/b.txt') os.remove('/tmp/xx/b.txt') os.rmdir('/tmp/xx') 
      用python編寫一個簡單的shell 
        #!/usr/bin/python 
        import os, sys 
        cmd = sys.stdin.readline() 
        while cmd: 
            os.system(cmd) 
            cmd = sys.stdin.readline() 
            
  用os.path編寫平臺無關的程式 
    os.path.abspath("1.txt") == os.path.join(os.getcwd(), "1.txt") 
    os.path.split(os.getcwd()) 用於分開一個目錄名稱中的目錄部分和文件名稱部分。 
    os.path.join(os.getcwd(), os.pardir, 'a', 'a.doc') 全成路徑名稱. 
      os.pardir 表示當前平臺下上一級目錄的字元 .. 
    os.path.getctime("/root/1.txt")  返回1.txt的ctime(創建時間)時間戳 
    os.path.exists(os.getcwd()) 判斷文件是否存在 
    os.path.expanduser('~/dir') 把~擴展成用戶根目錄 
    os.path.expandvars('$PATH') 擴展環境變數PATH 
    os.path.isfile(os.getcwd()) 判斷是否是文件名,1是0否 
    os.path.isdir('c:\Python26\temp') 判斷是否是目錄,1是0否 
    os.path.islink('/home/huaying/111.sql') 是否是符號連接 windows下不可用 
    os.path.ismout(os.getcwd()) 是否是文件系統安裝點 windows下不可用 
    os.path.samefile(os.getcwd(), '/home/huaying') 看看兩個文件名是不是指的是同一個文件 
    os.path.walk('/home/huaying', test_fun, "a.c")  
      遍歷/home/huaying下所有子目錄包括本目錄,對於每個目錄都會調用函數test_fun. 
      例:在某個目錄中,和他所有的子目錄中查找名稱是a.c的文件或目錄。 
        def test_fun(filename, dirname, names): //filename即是walk中的a.c dirname是訪問的目錄名稱 
            if filename in names: //names是一個list,包含dirname目錄下的所有內容 
                print os.path.join(dirname, filename) 
        os.path.walk('/home/huaying', test_fun, "a.c") 
        
  文件操作 
    打開文件 
      f = open("filename", "r") r只讀 w寫 rw讀寫 rb讀二進位 wb寫二進位 w+寫追加 
    讀寫文件 
      f.write("a") f.write(str) 寫一字元串 f.writeline() f.readlines() 與下read類同 
      f.read() 全讀出來 f.read(size) 表示從文件中讀取size個字元 
      f.readline() 讀一行,到文件結尾,返回空串. f.readlines() 讀取全部,返回一個list. list每個元素表示一行,包含"\n"\ 
      f.tell() 返回當前文件讀取位置 
      f.seek(off, where) 定位文件讀寫位置. off表示偏移量,正數向文件尾移動,負數表示向開頭移動。 
        where為0表示從開始算起,1表示從當前位置算,2表示從結尾算. 
      f.flush() 刷新緩存 
    關閉文件 
      f.close() 
      
  regular expression 正則表達式 import re 
    簡單的regexp 
      p = re.compile("abc") if p.match("abc") : print "match" 
      上例中首先生成一個pattern(模式),如果和某個字元串匹配,就返回一個match object 
      除某些特殊字元metacharacter元字元,大多數字元都和自身匹配。 
      這些特殊字元是 。^ $ * + ? { [ ] \ | ( ) 
    字元集合(用[]表示) 
      列出字元,如[abc]表示匹配a或b或c,大多數metacharacter在[]中只表示和本身匹配。例: 
        a = ".^$*+?{\\|()"  大多數metachar在[]中都和本身匹配,但"^[]\"不同 
        p = re.compile("["+a+"]") 
        for i in a: 
            if p.match(i): 
                print "[%s] is match" %i 
            else: 
                print "[%s] is not match" %i 
        在[]中包含[]本身,表示"["或者"]"匹配.用\[和\]表示. 
        ^出現在[]的開頭,表示取反.[^abc]表示除了a,b,c之外的所有字元。^沒有出現在開頭,即於身身匹配。 
        -可表示範圍.[a-zA-Z]匹配任何一個英文字母。[0-9]匹配任何數字。 
        \在[]中的妙用。 
          \d [0-9] 
          \D [^0-9] 
          \s [ \t\n\r\f\v] 
          \S [^ \t\n\r\f\v] 
          \w [a-zA-Z0-9_] 
          \W [^a-zA-Z0-9_] 
          \t 表示和tab匹配, 其他的都和字元串的表示法一致 
          \x20 表示和十六進位ascii 0x20匹配 
          有了\,可以在[]中表示任何字元。註:單獨的一個"."如果沒有出現[]中,表示出了換行\n以外的匹配任何字元,類似[^\n]. 
      regexp的重覆          
        {m,n}表示出現m個以上(含m個),n個以下(含n個).  如ab{1,3}c和abc,abbc,abbbc匹配,不會與ac,abbbc匹配。 
        m是下界,n是上界。m省略表下界是0,n省略,表上界無限大。 
        *表示{,} +表示{1,} ?表示{0,1} 
        最大匹配和最小匹配 python都是最大匹配,如果要最小匹配,在*,+,?,{m,n}後面加一個?. 
        match object的end可以得到匹配的最後一個字元的位置。 
          re.compile("a*").match('aaaa').end()     4  最大匹配 
          re.compile("a*?").match('aaaa').end()    0  最小匹配 
      使用原始字元串 
        字元串表示方法中用\\表示字元\.大量使用影響可讀性。 
        解決方法:在字元串前面加一個r表示raw格式。 
        a = r"\a" print a 結果是\a 
        a = r"\"a" print a 結果是\"a 
      使用re模塊 
        先用re.compile得到一個RegexObject 表示一個regexp 
        後用pattern的match,search的方法,得到MatchObject 
        再用match object得到匹配的位置,匹配的字元串等信息 
        RegxObject常用函數: 
          >>> re.compile("a").match("abab") 如果abab的開頭和re.compile("a")匹配,得到MatchObject 
          <_sre.SRE_Match object at 0x81d43c8> 
          >>> print re.compile("a").match("bbab") 
          None 註:從str的開頭開始匹配          
          >>> re.compile("a").search("abab") 在abab中搜索第一個和re_obj匹配的部分 
          <_sre.SRE_Match object at 0x81d43c8> 
          >>> print re.compile("a").search("bbab") 
          <_sre.SRE_Match object at 0x8184e18> 和match()不同,不必從開頭匹配          
          re_obj.findall(str) 返回str中搜索所有和re_obj匹配的部分. 
            返回一個tuple,其中元素是匹配的字元串. 
        MatchObject的常用函數 
          m.start() 返回起始位置,m.end()返回結束位置(不包含該位置的字元). 
          m.span() 返回一個tuple表示(m.start(), m.end()) 
          m.pos(), m.endpos(), m.re(), m.string() 
            m.re().search(m.string(), m.pos(), m.endpos()) 會得到m本身 
          m.finditer()可以返回一個iterator,用來遍歷所有找到的MatchObject. 
            for m in re.compile("[ab]").finditer("tatbxaxb"): 
            print m.span() 
      高級regexp 
        | 表示聯合多個regexp. A B兩個regexp,A|B表示和A匹配或者跟B匹配. 
        ^ 表示只匹配一行的開始行首,^只有在開頭才有此特殊意義。 
        $ 表示只匹配一行的結尾 
        \A 表示只匹配第一行字元串的開頭 ^匹配每一行的行首 
        \Z 表示只匹配行一行字元串的結尾 $匹配第一行的行尾 
        \b 只匹配詞的邊界 例:\binfo\b 只會匹配"info" 不會匹配information 
        \B 表示匹配非單詞邊界 
        示例如下: 
          >>> print re.compile(r"\binfo\b").match("info ") #使用raw格式 \b表示單詞邊界 
          <_sre.SRE_Match object at 0x817aa98> 
          >>> print re.compile("\binfo\b").match("info ") #沒有使用raw \b表示退格符號 
          None 
          >>> print re.compile("\binfo\b").match("\binfo\b ") 
          <_sre.SRE_Match object at 0x8174948> 
      分組(Group) 示例:re.compile("(a(b)c)d").match("abcd").groups()   ('abc', 'b')        
        #!/usr/local/bin/python        
        import re        
        x = """ 
        name: Charles 
        Address: BUPT 
        
        name: Ann 
        Address: BUPT 
        """        
        #p = re.compile(r"^name:(.*)\n^Address:(.*)\n", re.M) 
        p = re.compile(r"^name:(?P.*)\n^Address:(?P .*)\n", re.M) 
        for m in p.finditer(x): 
                print m.span() 
                print "here is your friends list" 
                print "%s, %s"%m.groups() 
      Compile Flag 
        用re.compile得到RegxObject時,可以有一些flag用來調整RegxObject的詳細特征. 
          DOTALL, S 讓.匹配任意字元,包括換行符\n 
          IGNORECASE, I 忽略大小寫 
          LOCALES, L 讓\w \W \b \B和當前的locale一致 
          MULTILINE, M 多行模式,隻影響^和$(參見上例) 
          VERBOSE, X verbose模式


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • MicroService.Core MicroService.Core 的初衷是為了方便的創建一個微服務, 可作為 Windows Service 或者控制台模式啟動。 它底層使用了 OWin 自托管技術,拋棄了微軟 Mvc 的那套東 西,進而選擇了 Nancy,使得開發過程很順心,很簡單! 快速入 ...
  • 2.1 自定義類庫 自定義類庫能封裝核心代碼,保證核心的代碼在交付給客戶時,不讓客戶泄露,同時也防止非專業人士的私自更改。另外能提高程式代碼的復用率,使得代碼量減少,程式結構簡潔。自定義類庫就是程式中常見的.dll文件。 新建一個people的自定義類庫,其實吧,就和java中的導包一樣的。 類庫和 ...
  • 里氏轉換: Person p=new Student(); 如果說子類可以賦值給父類 那我們應該聲明一個父類類型去指向子類對象 如果說父類中裝的是子類對象 可以考慮將父類強轉為子類對象用 is 轉換成功返回 true as 轉換成功返回對應的對象 來接收ss students ss =p as st ...
  • 工作上的JS代碼就沒必要截圖了,只是簡單的做一下筆記,以後如果還需要類似的運用也能快速提醒最近 前臺顯示 地址信息大家存儲的都是編號,這個比較簡單,不好意思寫太細節,直接返回前臺字典形式數據 後臺代碼如下 ...
  • Expression<Func<CustomerType, bool>> expression = c => (c.Id != null); var c = from u in ccc where u.Name == editModel.Name select u.Name; ccc.Select( ...
  • 根據微軟MSDN,.Net Core無論是1.x還是2.0都只支持64位系統。 準備 以下是 支持的系統版本 以下 Linux 64 位(x86_64 或 amd64)發行版本/版本支持 .NET Core 1.x: Red Hat Enterprise Linux 7 CentOS 7 Oracl ...
  • 看了老K大神的python操作excel的視頻,記錄下常用方法,非常感謝老k的分享! 需要安裝xlrd模塊, 打開cmd,輸入命令:pip install xlrd 進行安裝,若已安裝顯示如下: xlrd讀取excel常用方法如下: ...
  • 參考博客:http://www.cnblogs.com/lincj/p/5617605.html 一、os.walk() os.walk(top, topdown=True, onerror=None, followlinks=False) 可以得到一個三元tupple(dirpath, dirna ...
一周排行
    -Advertisement-
    Play Games
  • 問題 有很多應用程式在驗證JSON數據的時候用到了JSON Schema。 在微服務架構下,有時候各個微服務由於各種歷史原因,它們所生成的數據對JSON Object屬性名的大小寫規則可能並不統一,它們需要消費的JSON數據的屬性名可能需要大小寫無關。 遺憾的是,目前的JSON Schema沒有這方 ...
  • 首先下載centos07鏡像,建議使用阿裡雲推薦的地址: https://mirrors.aliyun.com/centos/7.9.2009/isos/x86_64/?spm=a2c6h.25603864.0.0.59b5f5ad5Nfr0X 其實這裡就已經出現第一個坑了 centos 07 /u ...
  • 相信很多.NETer看了標題,都會忍不住好奇,點進來看看,並且順便準備要噴作者! 這裡,首先要申明一下,作者本人也非常喜歡Linq,也在各個項目中常用Linq。 我愛Linq,Linq優雅萬歲!!!(PS:順便吐槽一下,隔壁Java從8.0版本推出的Streams API,抄了個四不像,一點都不優雅 ...
  • 在人生的重要時刻,我站在了畢業的門檻上,望著前方的道路,心中涌動著對未來的無限憧憬與些許忐忑。面前,兩條道路蜿蜒伸展:一是繼續在職場中尋求穩定,一是勇敢地走出一條屬於自己的創新之路。儘管面臨年齡和現實的挑戰,我仍舊選擇勇往直前,用技術這把鑰匙,開啟新的人生篇章。 迴首過去,我深知時間寶貴,精力有限。 ...
  • 單元測試 前言 時隔多個月,終於抽空學習了點新知識,那麼這次來記錄一下C#怎麼進行單元測試,單元測試是做什麼的。 我相信大部分剛畢業的都很疑惑單元測試是乾什麼的?在小廠實習了6個月後,我發現每天除了寫CRUD就是寫CRUD,幾乎用不到單元測試。寫完一個功能直接上手去測,當然這隻是我個人感受,僅供參考 ...
  • 一:背景 1. 講故事 最近在分析dump時,發現有程式的卡死和WeakReference有關,在以前只知道怎麼用,但不清楚底層邏輯走向是什麼樣的,藉著這個dump的契機來簡單研究下。 二:弱引用的玩法 1. 一些基礎概念 用過WeakReference的朋友都知道這裡面又可以分為弱短和弱長兩個概念 ...
  • 最近想把ET打表工具的報錯提示直接調用win系統彈窗,好讓策劃明顯的知道表格哪裡填錯數據,彈窗需要調用System.Windows.Forms庫。操作如下: 需要在 .csproj 文件中添加: <UseWindowsForms>true</UseWindowsForms> 須將目標平臺設置為 Wi ...
  • 從C#3開始,拓展方法這一特性就得到了廣泛的應用。 此功能允許你能夠使用實例方法的語法調用某個靜態方法,以下是一個獲取/創建文件的靜態方法: public static async Task<StorageFile> GetOrCreateFileAsync(this StorageFolder f ...
  • 在Windows 11下,使用WinUI2.6以上版本的ListView長這樣: 然而到了Win10上,儘管其他控制項的樣式沒有改變,但ListViewItem變成了預設樣式(初代Fluent) 最重大的問題是,Win10上的HorizontalAlignment未被設置成Stretch,可能造成嚴重 ...
  • 前言 周六在公司加班,幹完活後越顯無聊,想著下載RabbiitMQ做個小項目玩玩。然而這一下就下載了2個小時,真讓人頭痛。 簡單的講一下如何安裝吧,網上教程和踩坑文章還是很多的,我講我感覺有用的文章放在本文末尾。 安裝地址 erlang 下載 - Erlang/OTP https://www.erl ...