Python 實現的關鍵詞查找小工具

来源:http://www.cnblogs.com/chriscabin/archive/2016/07/11/5659341.html
-Advertisement-
Play Games

原文鏈接: "克裡斯的小屋——Python 實現的關鍵詞查找小工具" 引言 平時工作時,有時會遇到這樣的情景:在一個目錄及其子目錄下所有的文本文件中查找某個關鍵字、詞或者完整的句子。當然,如果是在 平臺上, 就能實現這樣的功能。不過最近學習了 相關的知識,自然是想做出一款帶有界面的小工具,可以跨平臺 ...


原文鏈接: 克裡斯的小屋——Python 實現的關鍵詞查找小工具

引言

平時工作時,有時會遇到這樣的情景:在一個目錄及其子目錄下所有的文本文件中查找某個關鍵字、詞或者完整的句子。當然,如果是在Linux平臺上,find+egrep就能實現這樣的功能。不過最近學習了Python tkinter相關的知識,自然是想做出一款帶有界面的小工具,可以跨平臺使用。所以,本文介紹的小工具,主要就是為了鞏固學習到的Python tkinter知識,同時也是為了方便自己。

涉及的 Python 及 tkinter 的知識

  1. os.walk函數:負責遍歷目錄下所有的文件;
  2. mimetypes.guess_type函數:負責給出文件的類型,從而過濾出非文本文件;
  3. Listbox組件的使用及滑鼠雙擊事件的綁定;
  4. pack佈局;
  5. 生產者+消費者 線程模型,主線程(GUI)負責消費來自後臺線程搜索得到的文件路徑結果,並及時顯示出來;
  6. Ubuntu平臺下,使用os.system('nautilus file_path)'定位到指定的文件。

功能

  1. 在指定目錄及其子目錄下所有的文本文件中查找關鍵字、詞和句子;
  2. Ubuntu上支持雙擊列表項目,自動使用nautilus文件管理器定位到指定位置。

關鍵代碼

完整的小工具源碼參見keyword-searcher,以下是搜索部分的代碼,比較簡單。

def _find(self, path, keyword):
       if not os.path.exists(path):
           return None
                     
       for this_dir, sub_dirs, files in os.walk(path):
           for file in files:
               file_type = guess_type(file)[0]
               if file_type and 'text' in file_type:
                   fp = os.path.join(this_dir, file)
                   self._result_queue.put(fp) if keyword in open(fp).read() else None

運行截圖

keyword-searcher 運行截圖

參考


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Windows10 IoT Core 使用 C#創建 IoT設備應用程式,通過應用程式創建IoT設備本地SQLite資料庫,並創建數據表,執行插入、更新、刪除數據等操作。 ...
  • 這個效果我不太會描述 PlaceHolder直譯占位符 也有人把這個效果叫水印效果 就是和HTML5的PlaceHolder屬性一樣的效果 上圖直觀: 使用方法: 首先下載 占位符行為dll.rar 在項目中引用dll 1.在VS中 引用System.Windows.Interactivity.dl ...
  • 在觸屏設備上,手指滑動頁面,或者單擊導航選項時,增加導航下橫線滑動的效果: 這個版本有點簡單粗暴,同事在項目中優化了一下演算法。這裡只是簡單記錄一下大致思路: 1、導航使用 ListView 控制項,下麵使用 Pivot 控制項 大致結構為: 頁面中的 ListView: 選中時,播放的位移動畫: Piv ...
  • 主要介紹相干衍射成像(coherent diffractive imaging,CDI),以及其中用到的各種相位恢復演算法,包含幾何光學、傅里葉光學、泛函、最優化理論方面的東西。會以 MATLAB 和 OpenCV 兩種方式公佈代碼。 MATLAB代碼是我過去幾年的工作成果,主要是想重寫成OpenCV ...
  • scanf是很敏感的,最好不要在scanf下做精度、場寬的設置,否則輸入可能會失效。 例: #include <stdio.h> int main(void){ int a = 0; scanf("%5d",&a); printf("a = %d",a); return 0;} 我運行這個代碼,在輸 ...
  • 1.安裝 版本說明:Win10+R3.2.5+JKD1.7+eclipse-jee-mars-R-win32-x86_64 2.R中調用Java 載入rJava包,運行library(rJava),註意:在一個會話中,包只需載入一次。如果需要,你可以自定義啟動環境以自動載入會頻繁使用的那些包,下麵是 ...
  • 有以下文本 要求匹配 註釋外的內容,匹配之後的內容: aaa bbb ddd eee hhh 可以利用/^xxx/../^xxx/結構來匹配 ,但是出現了以下的嵌套結構: aaa bbb #if defined(lxx_mmi_del) ccc #endif ddd eee #if defined( ...
  • 一、文件的編碼 分析: * 1. “& 0xff”的解釋: * 0xFF表示的是16進位(十進位是255),表示為二進位就是“11111111”。 * 那麼&符表示的是按位數進行與(同為1的時候返回1,否則返回0) * 2.位元組byte與int類型轉換: * Integer.toHexString( ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...