若快打碼平臺python開發文檔修改版

来源:https://www.cnblogs.com/zepc007/archive/2019/01/10/10247916.html
-Advertisement-
Play Games

一、打碼的作用 在進行爬蟲過程中,部分網站的登錄驗證碼是比較簡單的,例如四個英文數字隨機組合而成的驗證碼,有的是全數字隨機組成的驗證碼,有的是全中文隨機組成的驗證碼。為了爬蟲進行自動化,需要解決自動登錄的問題,而驗證碼問題成了第一道坎。起初想到用百度AI的圖像識別技術進行識別,但識別結果卻很差,最後 ...


一、打碼的作用

  在進行爬蟲過程中,部分網站的登錄驗證碼是比較簡單的,例如四個英文數字隨機組合而成的驗證碼,有的是全數字隨機組成的驗證碼,有的是全中文隨機組成的驗證碼。為了爬蟲進行自動化,需要解決自動登錄的問題,而驗證碼問題成了第一道坎。起初想到用百度AI的圖像識別技術進行識別,但識別結果卻很差,最後還是想起用打碼平臺來解決吧。打碼平臺的識別率算起來還是比較高的,所有花錢還是能辦事的。

二、若快打碼原python開發文檔

  在若快官網下載的python文檔我覺得寫得過於臃腫,但開發思想(面向對象編程)還是值得肯定的,但有時候能簡即簡,畢竟我們只是為了獲取識別結果而已。原開發文檔代碼如下:

 1 #!/usr/bin/env python
 2 # coding:utf-8
 3 
 4 import requests
 5 from hashlib import md5
 6 
 7 
 8 class RClient(object):
 9 
10     def __init__(self, username, password, soft_id, soft_key):
11         self.username = username
12         self.password = md5(password.encode('utf-8').hexdigest()
13         self.soft_id = soft_id
14         self.soft_key = soft_key
15         self.base_params = {
16             'username': self.username,
17             'password': self.password,
18             'softid': self.soft_id,
19             'softkey': self.soft_key,
20         }
21         self.headers = {
22             'Connection': 'Keep-Alive',
23             'Expect': '100-continue',
24             'User-Agent': 'ben',
25         }
26 
27     def rk_create(self, im, im_type, timeout=60):
28         """
29         im: 圖片位元組
30         im_type: 題目類型
31         """
32         params = {
33             'typeid': im_type,
34             'timeout': timeout,
35         }
36         params.update(self.base_params)
37         files = {'image': ('a.jpg', im)}
38         r = requests.post('http://api.ruokuai.com/create.json', data=params, files=files, headers=self.headers)
39         return r.json()
40 
41     def rk_report_error(self, im_id):
42         """
43         im_id:報錯題目的ID
44         """
45         params = {
46             'id': im_id,
47         }
48         params.update(self.base_params)
49         r = requests.post('http://api.ruokuai.com/reporterror.json', data=params, headers=self.headers)
50         return r.json()
51 
52 
53 if __name__ == '__main__':
54     rc = RClient('普通用戶賬號', '普通用戶賬號密碼', '軟體ID', '軟體key')
55     im = open('a.jpg', 'rb').read()
56     print(rc.rk_create(im, 3040)['Result'])

下載他們的開發文檔代碼後研讀了一遍發現還有錯誤的,就是在進行用戶密碼md5加密時候竟然沒有二進位化!!!罷了,可能是壓根就沒測這文檔,自己弄吧還是。。。

三、官方文檔修改版

  官方文檔寫的真是太難受了,最後還是修改一下,代碼如下:

# !/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
from hashlib import md5


def get_code_text(file_name, img_type):
    """
    獲取驗證碼
    :param file_name: 驗證碼本地圖片的路徑
    :param img_type: 要識別的驗證碼類型
    :return: 識別後的驗證碼
    """

    headers = {
        'Connection': 'Keep-Alive',
        'Expect': '100-continue',
        'User-Agent': 'ben',
    }
    params = {
        'username': '普通用戶賬號',
        'password': md5('普通用戶賬號密碼'.encode('utf8')).hexdigest(),
        'softid': '120055',
        'softkey': '6b4977398eb94ddeb0f733e18982042f',
        'typeid': img_type,
        'timeout': 30,
    }
    with open(file_name, 'rb') as f:
        content = f.read()
    files = {'image': (file_name, content)}
    res = requests.post('http://api.ruokuai.com/create.json', data=params,
                        files=files, headers=headers)
    return res.json()['Result']

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 單例模式是軟體工程中最著名的模式之一。從本質上講,單例是一個只允許創建自身的單個實例的類,並且通常可以簡單地訪問該實例。最常見的是,單例不允許在創建實例時指定任何參數——否則對實例的第二個請求但具有不同的參數可能會有問題!(如果對於具有相同參數的所有請求都應訪問相同的實例,則工廠模式更合適。)本文... ...
  • 個人博客原文: "開閉原則" 設計模式六大原則之六:開閉原則。 簡介 姓名 :開閉原則 英文名 :Open Closed Principle 價值觀 :老頑童就是我,休想改變我 個人介紹 : Software entities (classes, modules, functions, etc.) ...
  • 1、RocketMQ消息隊列簡單介紹 這裡簡單介紹一下RocketMQ的消息隊列的模型 一個topic對應多個隊列如下圖: 生產者和消費者分別向隊列中發送和消費消息,生產者和消費者都可以是多個,通過組名進行群組約束。由於負載因素造成生產消息會生產到各個queue中。 消費群組進行queue消費時首先 ...
  • 什麼是工廠模式? 提到工廠,我們肯定首先想到的就是生產東西的地方,之所以叫做工廠模式也正是如此,工廠模式就是根據工廠類來調用自身靜態方法來生產不同對象實例。 工廠模式的應用場景還是挺多的,比如我們使用的各個框架(ThinkPHP,Laravel),為什麼我們定了各個控制器和方法後通過在瀏覽器通過輸入 ...
  • 單例模式,是一種常用的軟體設計模式。在它的核心結構中只包含一個被稱為單例的特殊類。通過單例模式可以保證系統中一個類只有一個實例。即一個類只有一個對象實例。 提示: 資料庫連接池的設計一般也是採用單例模式,因為資料庫連接是一種資料庫資源。資料庫軟體系統中使用資料庫連接池,主要是節省打開或者關閉資料庫連 ...
  • 按理說應該把書全都看完一遍,再開始寫博客比較科學,會有比較全面的認識。 但是既然都決定要按規律更新博客了,只能看完一個設計模式寫一篇了。 也算是逼自己思考了,不是看完就過,至少得把代碼自己都敲一遍。 剛開始可能寫的比較淺顯,更像是讀書筆記,只能未來回來完善了。 廢話啰嗦到這,開始正題。 文章是以一個 ...
  • 一、UML概述 UML(UnifiedModelingLanguage)統一建模語言,是面向對象軟體的標準化建模語言。由於面向對象軟體開發需要經過OOA(面向對象分析),OOD(面向對象設計),OOP(面向對象編程)三個階段,每個階段都需要統一的符號設計描述和交流,而UML就是這種統一的符號表示。 ...
  • import和liabrary指令可以幫助你創建模塊化,可復用的代碼。庫不僅僅提供API,也是一個私有化單元:庫中已下劃線(_)開頭的類都是對外不可訪問的。每個Dart的應用也是一個包,儘管它沒有使用包的聲明。 庫都採用包的形式發佈。具體看 "Pub Package and Asset Manage ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...