用過手機QQ就知道,點擊一個圖片會彈出一個小功能,那就是提取圖片中的文字。非常方便實用,那麼很難實現嗎? 利用Python提取圖片中的文字信息,只需要一行代碼就能搞定! 當然,這是吹牛皮的,但是真正的Python代碼也就第4行,說是一行代碼搞定也沒錯。 示例: 效果 儘管運行Python代碼後也有幾 ...
用過手機QQ就知道,點擊一個圖片會彈出一個小功能,那就是提取圖片中的文字。非常方便實用,那麼很難實現嗎?
利用Python提取圖片中的文字信息,只需要一行代碼就能搞定!
當然,這是吹牛皮的,但是真正的Python代碼也就第4行,說是一行代碼搞定也沒錯。
示例:
效果
儘管運行Python代碼後也有幾個錯誤的地方,但是大部分是識別正確的。
你以為就這樣結束了嗎?那這麼簡單,我都不用出教程了。一行代碼實現這個功能當然也是要有前戲的。
一,pytesseract和PIL的安裝
pip安裝
2,pycharm編輯器能夠快速安裝,這就看你是否用pycharm了。
pycharm的Settings設置頁按照下麵步驟操作
安裝好了pytesseract,安裝PIL在上面第三步里搜索PIL並點擊安裝就可以了。
安裝好了所有庫,運行下麵Python代碼
出現報錯
可以看到提示:未安裝識別引擎tesseract-ocr
二,安裝識別引擎tesseract-ocr
1.網上下載安裝包,然後直接點擊安裝即可
因為tesseract-ocr預設不支持中文識別,所以解壓安裝tesseract-ocr後還需做如下操作
2,安裝完成tesseract-ocr後,我們還需配置好
打開後做如下操作
當然也能由pycharm快速打開pytesseract.py
第一步:
第二步:
第三步:
現在已經完成了所有配置,運行下麵Python代碼即可實現圖片里的文字提取
本文到此就結束了,希望各位Python越學越好,早日達成夢想。