Infi-chu: http://www.cnblogs.com/Infi-chu/ 模塊:filecmp 安裝:Python版本大於等於2.3預設自帶 功能:實現文件、目錄、遍歷子目錄的差異 常用方法: 1.單文件對比(cmp): 2.多文件對比(cmpfiles): 3.目錄對比(dircmp) ...
Infi-chu:
http://www.cnblogs.com/Infi-chu/
模塊:filecmp
安裝:Python版本大於等於2.3預設自帶
功能:實現文件、目錄、遍歷子目錄的差異
常用方法:
1.單文件對比(cmp):
- 採用filecmp.cmp(f1,f2[,shallow]) 方法,[]可空
- 比較f1和f2文件,相同返回True,否則False
- shallow預設為True,意思是只根據os.stat() 方法返回的文件基本信息進行對比,即文件基本信息。當為False時,os.stat() 與文件內容同時進行校驗
2.多文件對比(cmpfiles):
- 採用filecmp.cmpfiles(dir1,dir2,common[,shallow]) 方法
- 對比dir1和dir2目錄給定的文件清單。
- 此方法返迴文件名的三個列表:匹配、不匹配、錯誤
- 匹配:包含匹配的文件的列表
- 不匹配:與匹配相反
- 錯誤:目錄不存在文件、不具備讀許可權或其他原因導致的不能比較的文件清單
3.目錄對比(dircmp):
- 使用dircmp(a,b[,ignore[,hide]]) 類創建一個目錄比較對象
- a和b是參加比較的目錄名;
- ignore代表文件名忽略的列表,預設為['RCS','CVS','tags'];
- hide代表隱藏的列表,預設為[os.curdir,os.pardir]。
- dircmp類可以獲得目錄較為詳細的信息
- dircmp提供了三個輸出報告的方法:
- report(),比較當前指定目錄中的內容
- report_partial_closure(),比較當前指定目錄及第一級子目錄中的內容
- report_full_closure(),遞歸比較所有指定目錄的內容
- dircmp為輸出提供了更加詳細的比較結果,提供瞭如下屬性:
- left,左目錄,如上述的a
- right,右目錄,如上述的b
- left_list,左目錄中的文件及目錄列表
- right_list,右目錄中的文件及目錄列表
- common,兩邊目錄共同存在的文件或目錄
- left_only,只在左目錄中的文件或目錄
- right_only,只在右目錄中的文件或目錄
- common_dirs,兩邊目錄都存在的子目錄
- common_files,兩邊目錄都存在的子文件
- common_funny,兩邊目錄都存在的子目錄(不同目錄類型或os.stat()記錄的錯誤)
- same_files,匹配相同的文件
- diff_files,不匹配的文件
- funny_files,兩邊目錄中都存在,但無法比較的文件
- subdirs,將common_dirs目錄名映射到新的dircmp對象,格式是字典類型
比較dir1和dir2的目錄差異:(先自定義目錄下的文件與目錄,再使用)
1 #import filecmp 2 3 #a='/home/test/filecmp/dir1' # 左目錄 4 5 #b='/home/test/filecmp/dir2' # 右目錄 6 7 #dir_obj=filecmp.dircmp(a,b) 8 9 #dir_obj.report() 10 11 #dir_obj.report_partial_closure() 12 13 #dir_obj.report_full_closure() 14 15 #print('left_list:'+str(dir_obj.left_list)) 16 17 #print('right_list:'+str(dir_obj.right_list)) 18 19 #print('common'+str(dir_obj.common)) 20 21 # 根據上述屬性,以此類推
校驗源目錄與備份目錄的差異:
1 #import os 2 3 #import sys 4 5 #import filecmp 6 7 #import re 8 9 #import shutil 10 11 # 12 13 #holderlist=[] 14 15 # 16 17 #def compare(dir1,dir2): # 遞歸獲取更新項 18 19 # dircomp=filecmp.dircmp(dir1,dir2) 20 21 # only_in_one=dircomp.left_only # 源目錄更新文件或目錄 22 23 # diff_in_one=dircomp.diff_files # 不匹配文件,源目錄文件已發生變化 24 25 # dirpath=os.path.abspath(dir1) # 定義源目錄絕對路徑 26 27 # # 將更新文件名或目錄追加到holderlist 28 29 # [holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in only_in_one] 30 31 # [holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in diff_in_one] 32 33 # if len(dircomp.common_dirs) > 0: # 判斷目錄是否存在相同子目錄,便於遞歸 34 35 # for item in dircomp.common_dirs: # 遞歸子目錄 36 37 # compareme(os.path.abspath(os.path.join(dir1,item)), \ 38 39 # os.path.abspath(os.path.join(dir2,item))) 40 41 # return holderlist 42 43 # 44 45 #def main: 46 47 # if len(sys.argv) > 2: # 要求輸入源目錄與備份目錄 48 49 # dir1=sys.argv[1] 50 51 # dir2=sys.argv[2] 52 53 # else: 54 55 # print('使用:',sys.argv[0],'源目錄 備份目錄') 56 57 # sys.exit() 58 59 # source_files=compareme(dir1,dir2) # 對比兩個目錄 60 61 # dir1=os.path.abspath(dir1) 62 63 # if not dir2.endswith('/'): 64 65 # dir2=dir2+'/' # 備份目錄路徑加'/' 符 66 67 # dir2=os.path.abspath(dir2) 68 69 # destination_files=[] 70 71 # createdir_bool=False 72 73 # 74 75 # for item in source_files: # 遍歷返回的差異文件或目錄清單 76 77 # destination_dir=re.sub(dir1,dir2,item) # 將源目錄差異路徑清單對應替換成備份目錄 78 79 # destination_files.append( destination_dir) 80 81 # if os.path.isdir(item): # 如果差異路徑為目錄且不存在,則在備份目錄中創建 82 83 # if not os.path.exists(destination_dir): 84 85 # os.makedirs(destination_dir) 86 87 # createdir_bool=True 88 89 # if createdir_bool: # 重新調用,重新遍歷新創建目錄的內容 90 91 # destination_files=[] 92 93 # source_files=[] 94 95 # source_files=compareme(dir1,dir2) 96 97 # for item in source_files: # 獲取源目錄差異路徑清單,對應替換成備份目錄 98 99 # destination_dir=re.sub(dir1,dir2,item) 100 101 # destination_files.append(destination_dir) 102 103 # print('更新項:') 104 105 # print(source_files) # 輸出更新項列表清單 106 107 # copy_pair=zip(source_files,destination_files) # 將源目錄與備份目錄文件清單差分成元組 108 109 # for item in copy_pair: 110 111 # if os.path.isfile(item[0]): # 判斷是否是文件,然後進行複製操作 112 113 # shutil.copyfile(item[0],item[1]) 114 115 # 116 117 #if __name__='__main__': 118 119 # main()