python 驗證碼識別庫pytesseract的使用

来源:https://www.cnblogs.com/alpiny/archive/2019/03/07/10487191.html
-Advertisement-
Play Games

筆者環境 centos7 python3 pytesseract只是tesseract-ocr的一種實現介面。所以要先安裝tesseract-ocr(大名鼎鼎的開源的OCR識別引擎)。 依賴安裝 安裝依賴的leptonica庫 安裝tesseract-ocr 安裝語言包: 安裝pytesseract ...


筆者環境 centos7 python3

pytesseract只是tesseract-ocr的一種實現介面。所以要先安裝tesseract-ocr(大名鼎鼎的開源的OCR識別引擎)。

 

依賴安裝

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

 

安裝依賴的leptonica庫

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz  
tar -xzvf leptonica-1.72.tar.gz  
cd leptonica-1.72
./configure
make && make install

 

安裝tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00  Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz  
cd tesseract-3.04.00/
./configure
make && make install

 

安裝語言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文預設包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata  #中文繁體
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文簡體

cp/mv *.traineddata /usr/local/share/tessdata/ #移動下載的包到/usr/local/share/tessdata/ 這個路徑下,也可以手動移動

 

安裝pytesseract:

pip install Pillow 
pip install pytesseract

  

 

至此安裝完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

 

 

參考資料:

https://www.cnblogs.com/dajianshi/p/4932882.html
https://stackoverflow.com/questions/33659458/tesseract-image-issue

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Adapter(適配器模式) 加個“適配器”以便於復用 將一個類的介面轉換成客戶希望的另一個介面。Adapter模式使得原本由於介面不相容而不能一起工作的那些類可以一起工作。 應用場景 如果我們的代碼依賴一些外部的API,或者依賴一些可能會經常更改的類,那麼應該考慮用適配器模式。 你想使用一個已經存 ...
  • 參考鏈接:1. PS流的格式和解析總結 http://www.cnblogs.com/lihaiping/p/4181607.html 2. TS科普5 PES包解析 https://blog.csdn.net/cabbage2008/article/details/49612011 PES包的解析 ...
  • Java就是用來做項目的!Java的主要應用領域就是企業級的項目開發!要想從事企業級的項目開發,你必須掌握如下要點:1、掌握項目開發的基本步驟2、具備極強的面向對象的分析與設計技巧3、掌握用例驅動、以架構為核心的主流開發方法沒有人願意自己一輩子就滿足於掌握了一些代碼實現的技巧,別人告訴你要實現什麼, ...
  • 前言 開心一刻 本人幼教老師,冬天戴帽子進教室,被小朋友看到,這時候,有個小家伙對我說:老師你的帽子太醜,趕緊摘了吧。我逗他:那你好好學習,以後給老師買個漂亮的?這孩子想都沒想立刻回答:等我賺錢了,帶你去南韓整形 簡單示例 我們先來看一個純粹的mybatis示例(不集成spring等其他框架),代碼 ...
  • 經 @沈默 在上文 "Antlr4添加中文變數賦求值,括弧,各種問題" 評論中指出, 語法規則描述依賴於Antlr4生成的語法分析器的預設分析方法, 比如運算符的左聯繫, 以及優先順序處理等等. 於是將語法修改為下麵(源碼版本號: "program in chinese/quan5" ): 這樣做的結 ...
  • 中文編程 "知乎專欄" 原文 "地址" (前文 "通用型的中文編程語言探討之一: 高考" , 即使是這"第一步", 即使一切順利達到列出的功能恐怕也需要個人數年的業餘時間. 看到不少乎友都遠更有資本和實力更快速地完成這一工程. 希望隨時告知類似項目, 省得在下作無用功) 初步打算用Antlr4生成J ...
  • 中文編程 "知乎專欄" 原文 "地址" 基本參考https://pragprog.com/book/tpantlr2/the definitive antlr 4 reference 一書"Building a Calculator Using a Visitor"一節, 僅添加了數學乘除法符號的支 ...
  • 在可預見的未來, 高考仍是最重要的也最有社會影響力的人才選拔機制. 很久沒有關註, 最近得知高考自選科目中開始增加了編程一項(見 "如何評價2017浙江高考七選三科目中包含技術?" ). 雖然個人對編程是否應該進入高考仍有保留看法, 但至少全民(都應該可以)編程這一趨勢已經很明顯了. 這應該是中文編 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...