使用python庫解決登錄的驗證碼識別-圖片驗證碼

-Advertisement-

前言：在UI自動化測試和爬蟲測試中，驗證碼是個比較頭疼的問題，包括：圖片驗證碼，滑塊驗證碼，等一些常見的驗證碼場景。識別驗證碼的python 庫有很多，用起來也並不簡單，這裡推薦一個簡單實用的識別驗證碼的庫 ddddocr (帶帶弟弟ocr)庫。今天先用一個圖片驗證碼示例來演示下：準備： 1 ...

前言：

在UI自動化測試和爬蟲測試中，驗證碼是個比較頭疼的問題，包括：圖片驗證碼，滑塊驗證碼，等一些常見的驗證碼場景。

識別驗證碼的python 庫有很多，用起來也並不簡單，這裡推薦一個簡單實用的識別驗證碼的庫 ddddocr (帶帶弟弟ocr)庫。

今天先用一個圖片驗證碼示例來演示下：

準備：

1.安裝庫ddddocr

2.安裝庫pillow

3.以一個帶驗證碼登錄的網站為示例：https://xqctk.jtys.sz.gov.cn/

開始編碼：

1代碼如下：

 1 import time
 2 from ddddocr import DdddOcr
 3 from selenium import webdriver
 4 from selenium.webdriver.common.by import By
 5 from PIL import Image  # 需安裝 pillow
 6 
 7 path = 'https://xqctk.jtys.sz.gov.cn/'
 8 
 9 
10 def get_picture_code(locator):
11     pic_save_path = 'D://html.png'
12     cron_path = 'D://code.png'
13     browser.save_screenshot(pic_save_path)  # 保存為圖片
14     location = browser.find_element(By.XPATH, locator)  # 獲取需要識別的元素對象
15     size = location.size  # 獲取需要識別的元素尺寸
16     position = (int(location.location['x']), int(location.location['y']), int(location.location['x'] + size['width']), int(location.location['y'] + size['height']))
17     Image.open(pic_save_path).crop(box=position).save(cron_path)  # crop進行裁剪
18     with open(cron_path, 'rb') as f:
19         img_bytes = f.read()
20         res = DdddOcr().classification(img_bytes)
21     return res
22 
23 
24 browser = webdriver.Chrome()  # 打開瀏覽器
25 browser.maximize_window()  # 瀏覽器最大化
26 browser.get(path)  # 打開網頁
27 time.sleep(5)
28 pic_code = get_picture_code("//td[@id='incrementGetValidCodeImg']//img")
29 browser.find_element(By.XPATH, "//input[@id='incrementValidCode']").send_keys(pic_code)
30 time.sleep(5)
31 browser.quit()

運行結果：

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Rust中的 into和from如何使用？

說明使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹使用 VLD 時的註意事項。同系列文章目錄可見《記憶體泄漏檢測工具》目錄 1. 官網文檔可以在 Using-Visual-Leak-Detector 官方文檔里看到如何使用 VLD。 2. 註意事項以 v2.5.1 版本為例， ...
ThreadPoolExecutor源碼學習

線程池ThreadPoolExecutor ThreadPoolExecutor 繼承結構繼承結構如圖所示：ThreadPoolExecutor <- AbstractExecutorService <- ExecutorService <- Executor public class Threa ...
Go語言入門5（map哈希表）

Map 哈希表是一種巧妙並且實用的數據結構。它是一個無序的key/value對的集合，其中所有的key 都是不同的，然後通過給定的key可以在常數時間複雜度內檢索、更新或刪除對應的value。在Go語言中，一個map就是一個哈希表的引用，map類型可以寫為map[K]V，其中K和V分別對 ...
索引優化、優化，你又是一個好MongoDB！！！博學谷狂野架構師

MongoDB索引優化作者: 博學谷狂野架構師 GitHub：GitHub地址（有我精心準備的130本電子書PDF）只分享乾貨、不吹水，讓我們一起加油！😄 索引簡介索引通常能夠極大的提高查詢的效率，如果沒有索引，MongoDB在讀取數據時必須掃描集合中的每個文件並選取那些符合查詢條件的記錄 ...
Python property、setter、deleter

面向對象封裝特點之一就是通過實現好的方法來訪問，限制對數據的不合理訪問,把對象狀態私有化，僅供類的內部進行操作下方示例,Test方法的number屬性類實例的時候傳遞1,number是一個公開屬性，可以在外部任意修改、訪問,沒有對屬性進行進行約束 class Test: def __init__( ...
JVM：併發的可達性分析

當前主流編程語言的垃圾收集器基本上都是依靠可達性分析演算法來判定對象是否存活的，可達性分析演算法理論上要求全過程都基於一個能保障一致性的快照中才能夠進行分析，這意味著必須全程凍結用戶線程的運行。在根節點枚舉這個步驟中，由於 GC Roots 相比起整個 Java 堆中全部的對象畢竟還算是極少數，且在各 ...
扒一扒Nacos、OpenFeign、Ribbon、loadbalancer組件協調工作的原理

大家好，我是三友~~ 前幾天有個大兄弟問了我一個問題，註冊中心要集成SpringCloud，想實現SpringCloud的負載均衡，需要實現哪些介面和規範。既然這個兄弟問到我了，而我又剛好知道，這不得好好寫一篇文章來回答這個問題，雖然在後面的聊天中我已經回答過了。接下來本文就以探究一下Nacos ...
Python程式筆記20230301

列印九九乘法表 for i in range(1, 10): for j in range(1, i+1): print(i, "x", j, "=", i * j, end=' ') print("\n") 第三行的 print(i, "x", j, "=", i * j, end=' ') 列印 ...