python爬有道翻譯

来源:https://www.cnblogs.com/-jiandong/archive/2019/09/27/11600927.html
-Advertisement-
Play Games

在有道翻譯頁面中打開開發者工具,在Headers板塊找到Request URL以及相應的data。 上面這種很大可能被有道網頁給識別出來不是人工在訪問,而是代碼在訪問。 此時我們可以加個‘User-Agent’代理。通過設置User Agent來達到隱藏身份的目的,一般情況下瀏覽器是通過User-A ...


 

在有道翻譯頁面中打開開發者工具,在Headers板塊找到Request URL以及相應的data。

 

import urllib.request
import urllib.parse
import json

content=input('請輸入需要翻譯的內容:')

#_o要去掉,否則會出先error_code:50的報錯
url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'

data={}
#開發者工具里有,i和doctype鍵不可少
data['i']=content
data['from']='AUTO'
data['to']='AUTO'
data['smartresult']='dict'
data['client']='fanyideskweb'
data['salt']='15695569180611'
data['sign']='5b0565493d812bc5e713b895c12d615d'
data['doctype']='json'
data['version']='2.1'
data['keyfrom']='fanyi.web'
data['action']='FY_BY_REALTTIME'

#將字典類型的請求數據轉化為url編碼,並將編碼類型轉變為'utf-8'類型
data=urllib.parse.urlencode(data).encode('utf-8')

#向url請求data的響應結果
response=urllib.request.urlopen(url,data)

#讀取返回數據內容,decode是轉換返回數據的格式為str
html=response.read().decode('utf-8')

#使用json將字元串轉化成字典
target=json.loads(html)

#結果在key='translateResult'的三層列表的key='tgt'中
print("翻譯結果:%s" %(target['translateResult'][0][0]['tgt']))

 

  

上面這種很大可能被有道網頁給識別出來不是人工在訪問,而是代碼在訪問。

此時我們可以加個‘User-Agent’代理。通過設置User Agent來達到隱藏身份的目的,一般情況下瀏覽器是通過User-Agent來識別的。

 

通過調用urllib.request.Request()來設置UA。

 

class urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)

This class is an abstraction of a URL request.

  url should be a string containing a valid URL. 

  headers should be a dictionary #headers要為字典

 

有兩種方法設置User Agent:

    1.在創建Request對象的時候,填入headers參數(包含User Agent信息),這個Headers參數要求為字典;

    2.在創建Request對象的時候不添加headers參數,在創建完成之後,使用add_header()的方法,添加headers。

import urllib.request
import urllib.parse
import json
import time


while True:
    
    content=input('請輸入需要翻譯的內容(輸入"q!退出程式"):')

    if content=='q!':
        break;

    #_o要去掉,否則會出先error_code:50的報錯
    url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
    
    '''
    第一種方法
    head={}
    head['User-Agent']='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'
    '''
    
    data={}
    #開發者工具里有,i和doctype鍵不可少
    data['i']=content
    data['from']='AUTO'
    data['to']='AUTO'
    data['smartresult']='dict'
    data['client']='fanyideskweb'
    data['salt']='15695569180611'
    data['sign']='5b0565493d812bc5e713b895c12d615d'
    data['doctype']='json'
    data['version']='2.1'
    data['keyfrom']='fanyi.web'
    data['action']='FY_BY_REALTTIME'

    #將字典類型的請求數據轉化為url編碼,並將編碼類型轉變為'utf-8'類型
    data=urllib.parse.urlencode(data).encode('utf-8')

    '''
    第一種方法
    req=urllib.request.Request(url,data,head)
    '''
    #第二種方法設置User Agent
    #創建Request對象
    req=urllib.request.Request(url,data)
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36')

    #傳入創建好的Request對象
    response=urllib.request.urlopen(req)

    #讀取響應信息並解碼
    html=response.read().decode('utf-8')

    #使用json將字元串轉化成字典
    target=json.loads(html)

    #結果在key='translateResult'的三層列表的key='tgt'中
    print("翻譯結果:%s" %(target['translateResult'][0][0]['tgt']))

    #5秒一次
    time.sleep(5)
    

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 別看Spring現在玩的這麼花,其實它的“籌碼”就兩個,“容器”和“bean定義”。只有先把bean定義註冊到容器里,後續的一切可能才有可能成為可能。所以在進階的路上如果要想走的順暢些,徹底搞清楚bean定義註冊的所有細節至關重要。畢竟這是萬里長征的第一步。有句話怎麼說來著,“勿在浮沙築高臺”。Sp ...
  • 增加Security配置類 前面演示了一個簡單的登錄入門例子,使用springboot security預設的配置實現,雖然非常簡單,但是基本實現了登錄功能。不過在生產環境下,顯然不能僅僅使用如此簡單的登錄功能,我們還需要更多個性化的登錄配置,所以我們要使用配置類來代替預設配置。新建一個配置類 We ...
  • 前言:C++是博大精深的語言,特性複雜得跟北京二環一樣,繼承亂得跟亂倫似的。 不過它仍然是我最熟悉且必須用在游戲開發上的語言,這篇文章用於挑選出一些個人覺得重要的條款/經驗/技巧進行記錄總結。 文章最後列出一些我看過的C++書籍/博客等,方便參考。 其實以前也寫過相同的筆記博文,現在用markdow ...
  • Web應用安全管理 Web應用的安全管理,主要包括兩個方面的內容,一個是用戶身份的認證,即用戶登錄的設計,二是用戶授權,即一個用戶在一個應用系統中能夠執行哪些操作的許可權管理。許可權管理的設計一般使用角色來管理,即給一個用戶賦予哪些角色,這個用戶就具有哪些許可權。 Spring框架體系中,經典的安全體系框 ...
  • 一、協程 1.歷史進程: (1)3.4引入協程,用yield來實現 (2)3.5引入協程語法 (3)實現協程比較好的包有asyncio,tornado,gevent 2.定義:協程是為非搶占式多任務產生子程式的電腦程式組件,協程允許不同入口點在不同位置暫停或開始執行程式 3.從技術角度講,協程就是 ...
  • python面向函數式編程,模擬用戶登錄驗證、註冊的代碼實現。 主要有以下兩個文件: 1、user.txt文檔文件,相當於資料庫的用戶信息表,主要是記錄用戶名和密碼。 註意:1)此文檔需要與.py文件放在同一個路徑下。 2)用戶名、密碼在存儲時,是以$符號區別開。 2、模擬用戶登錄驗證、註冊的代碼實 ...
  • @[TOC]     下麵向大家介紹一下我在學習python課程的一些題目的解法,如果大家有什麼更好的解法請私信我。這裡只顯示題目與代碼。 1.快樂的數字     描述: 編寫一個演算法來確定一個數字是否“快樂”。 快樂的數字按照如下方式確定 ...
  • Spring框架主要包括IoC和AOP,這兩大功能都可以使用註解進行配置。 一、bean定義 二、依賴註入 三、使用Primary註解 四、Scope註解 五、方法註入 六、AOP註解 七、ComponentScan註解 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...