批量識別圖中文字自動命名，讓你1秒找到騷圖

-Advertisement-

自從上次批量的保存了半佛老師的各種騷圖之後： "我用Python一鍵保存了半佛老師所有的騷氣表情包" ，每次做視頻，找圖就相當的費勁，因為圖片太多，每次想要找到固定的圖的話。就像大海撈針一樣。因為上個版本的代碼保存圖片是截取部分圖片鏈接進行命名的，所以名稱是隨機的。所以今天我準備對這些圖片重新命名 ...

自從上次批量的保存了半佛老師的各種騷圖之後：我用Python一鍵保存了半佛老師所有的騷氣表情包，每次做視頻，找圖就相當的費勁，因為圖片太多，每次想要找到固定的圖的話。就像大海撈針一樣。因為上個版本的代碼保存圖片是截取部分圖片鏈接進行命名的，所以名稱是隨機的。

所以今天我準備對這些圖片重新命名。按照表情包中的文字來命名。所以我得找到能夠識別圖片中文字的方法。基礎的方法的話，那就需要安裝圖像處理相關的庫，像 pillow、pytesser3、Tesseract-OCR 等等庫。用這些庫識別圖片中的文字的成功率不是很高，所有我準備調用一下第三方的一些庫。我看了一下百度有個文字識別的API介面。我們需要在下麵地址註冊應用。

https://ai.baidu.com/tech/ocr

我們在文字識別裡面去創建一個應用，選擇圖片文字識別。

通用文字識別介面一天有5萬次免費調用次數，對我們保存的幾千多張的圖片來說，綽綽有餘了。

創建成功之後返回應用列表，我們可以看到剛剛創建的應用，有三個重要的參數，我們等下會用到 AppID、API Key、Secret Key。

我們就可以調用百度的這個識別圖片文字的API介面庫。我們首先需要安裝這個baidu-aip庫。

pip install baidu-aip

使用這個文字識別介面挑了幾張圖測試下效果：

總結下：

1、gif圖片不識別，只能識別靜態圖，jpg、png、jpeg等。
2、識別成功率並不是100%，比如「人」會被識別成「入」。

3、圖片中文字有換行的，都會分開以字典形式保存在 words_result 列表中。

我對有多行的文字全部加起來，組成一行文字。

圖片中有時會存在無法保存為名稱的符號。

我用 replace 方法對它進行替換去除。

title = t.replace('/', '').replace('\\', '').replace(':', '').replace('*', '').replace('?', '').replace('<', '')\
            .replace('>', '').replace('|', '').replace('.', '')

gif 動態圖無法識別，我們對它按照時間戳重命名。

表情包中沒有文字的，我們也以時間戳命名。

給出我們需要批量改名稱的文件夾目錄，使用 rename 方法就可以批量改名字。

當然，我們也可以對上個版本的代碼進行優化，就是邊保存圖片的時候邊重命名。在下載圖片的 download 方法後面加下根據表情包中文字重命名的方法即可。

效果如下：

這樣，大部分的圖片名稱就是根據圖中文字命名的，搜索起來更加方便了。比如，我要搜索「川人類之光普老師」的素材的時候，輸入「人類之光」就可以找到了。

最後，原創視頻昨天已發到 B 站，很魔性，一起來欣賞下吧！

硬核加倍，識別表情包中文字當成名稱命名，1秒找到我要的表情包

本文兩個版本的代碼（邊保存變改名和對一個目錄下的所有圖片批量改名）全部發在 GitHub 上了，在本公眾號「Python知識圈」後臺輸入框回覆「重命名」即可。
歡迎關註公眾號「Python知識圈」，公眾號後臺回覆關鍵字，獲取更多乾貨。

回覆「英語」：送你英語 7000 單詞速記法，親測非常有效。

回覆「編程」：免費獲贈2019最新編程資料，認真學完BAT offer 拿到手軟。

回覆「賺錢」：領取簡單可實操的 36 個賺錢的小項目，每天多賺100塊零花錢。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

switch結構的用法及作用

為什麼要使用switch 迴圈結構：因為多重if選擇結構從代碼上看的話，顯得結構複雜，容易出錯，代碼多，冗餘且有多次的等值判斷。為瞭解決上述問題，我們開發出switch選擇結構。 if選擇結構主要用於區間的判斷上如 boolean類型，switch選擇結構用於等值的判斷。 switch語法結構： ...
LeetCode 46. 全排列

46. 全排列題目來源： "https://leetcode cn.com/problems/permutations/" 題目給定一個沒有重覆數字的序列，返回其所有可能的全排列。示例: 解題思路思路：深度優化搜索先看題目，以所給數組 [1, 2, 3] 的全排列為例：以 1 開始， ...
Python將Sqlite3查詢結果保存為字典形式

```python import sqlite3 import os class DBOperate: def __init__(self,dbPath=os.path.join(os.getcwd(),"db")): self.dbPath=dbPath self.connect=sqlite3.... ...
進程管理工具 Supervisor

要想在終端後臺常駐進程，首先想到的是在命令後加 & 符號，來達到隱藏程式在後臺的目的，儘管看起來進程已經在後臺運行了，實際上終端會話關閉時進程還是會被 kill 掉，這種問題一般是採用搭配 nohup 命令來解決的，nohup 作用是忽略 SIGHUP 信號，而會話關閉時正好發送了該信號給會話內所有 ...
search（7）- elastic4s-search-filter模式

現在我們可以開始探討ES的核心環節：搜索search了。search又分filter,query兩種模式。filter模式即篩選模式：將符合篩選條件的記錄作為結果找出來。query模式則分兩個步驟：先篩選，然後對每條符合條件記錄進行相似度計算。就是多了個評分過程。如果我們首先要實現傳統資料庫的查詢功 ...
Django編寫自定義manage.py 命令

官網文檔地址： "編寫自定義 django admin 命令" 金句：你所浪費的今天，正是昨天死的人所期待的明天。開篇話：的命令我們用了很多，要是我們想要使用一些特定的較長的命令時，比如：（命令作用：運行項目測試時，使用指定的配置文件），這時每次運行的就很麻煩，可以通過設定自定義manage ...
MyBatis 一級緩存實現詳解及使用註意事項

一級緩存介紹在應用運行過程中，我們有可能在一次資料庫會話中，執行多次查詢條件完全相同的SQL，MyBatis提供了一級緩存的方案優化這部分場景，如果是相同的SQL語句，會優先命中一級緩存，避免直接對資料庫進行查詢，提高性能。具體執行過程如下圖所示。每個SqlSession回話中會創建Execut ...
Spring Security 是如何在 Servlet 應用中執行的？

Spring Security 是一個強大的認證和授權框架，它的使用方式也非常簡單，但是要想真正理解它就需要花一時間來學習了，最近在學習 Spring Security 時有一些新的理解，特意記錄下來防止知識忘記的太快，畢竟好記性不如爛筆關，也給即將準備學習 Spring Security 的同志做 ...