python爬蟲登陸問題

来源:https://www.cnblogs.com/qing0228/archive/2019/07/12/11178958.html
-Advertisement-
Play Games

根據騰訊課堂網頁登陸問題進行解說(需要安裝谷歌瀏覽器): 1、導入庫 2、根據騰訊課堂鏈接,進入頁面,獲取頁面中登陸的xpath,併進行點擊操作 3、進入登陸頁面之後獲取登陸方式,本次選擇使用qq進行登陸,獲取qq登陸的xpath併進行點擊操作。 4、點擊使用賬號密碼登陸。在該登陸過程中出現以下錯誤 ...


 根據騰訊課堂網頁登陸問題進行解說(需要安裝谷歌瀏覽器):

1、導入庫

import requests
from selenium import webdriver

2、根據騰訊課堂鏈接,進入頁面,獲取頁面中登陸的xpath,併進行點擊操作。

  獲取xpath的方法是:在如上所示箭頭所指登陸位置右擊操作,點擊檢查,獲取以下頁面。在登陸所在標簽處右擊進行複製xpath。

driver = webdriver.Chrome()
driver.get("https://ke.qq.com/course/403521")
driver.find_element_by_xpath('//*[@id="js_login"]').click()

3、進入登陸頁面之後獲取登陸方式,本次選擇使用qq進行登陸,獲取qq登陸的xpath併進行點擊操作。

driver.find_element_by_xpath('/html/body/div[4]/div/div[2]/div[2]/a[1]').click()

4、點擊使用賬號密碼登陸。在該登陸過程中出現以下錯誤。

  主要原因是無法找到我們定位的xpath,需要先找到定位元素所處的frame,並從frame中尋找該元素。

 

 

driver.switch_to_frame("login_frame_qq")//引號中添加frame標簽中的name或id值
driver.find_element_by_xpath('//*[@id="switcher_plogin"]').click()

5、獲取到輸入賬號密碼以及登陸位置的xpath。當運行時再次出現定位不到xpath的情況,使用第四步的方法依舊沒能成功,提示所在框架不對,估計是跟第4步的frame標簽的name相同的原因吧。最後的解決方法是:先回到最外層框架,之後進入要定位元素的框架,最後對賬號密碼進行定位。

 

driver.switch_to.default_content()//回到最外層框架
driver.switch_to_frame("login_frame_qq")//進入定位元素的框架
driver.find_element_by_xpath('//*[@id="u"]').clear()
driver.find_element_by_xpath('//*[@id="u"]').send_keys("輸入自己的賬號")
driver.find_element_by_xpath('//*[@id="p"]').clear()
driver.find_element_by_xpath('//*[@id="p"]').send_keys("輸入自己的密碼")

6、點擊登陸按鈕,至此就已經進入網頁版的騰訊課堂了。

driver.find_element_by_xpath('//*[@id="login_button"]').click()

 完整代碼如下:

import requests
from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://ke.qq.com/course/403521")
driver.find_element_by_xpath('//*[@id="js_login"]').click()
time.sleep(5)//等待響應 driver.find_element_by_xpath(
'/html/body/div[4]/div/div[2]/div[2]/a[1]').click() time.sleep(2)
driver.switch_to_frame("login_frame_qq")//引號中添加frame標簽中的name或id值
driver.find_element_by_xpath('//*[@id="switcher_plogin"]').click()
time.sleep(2)
driver.switch_to.default_content()//回到最外層框架
driver.switch_to_frame("login_frame_qq")//進入定位元素的框架
driver.find_element_by_xpath('//*[@id="u"]').clear()
driver.find_element_by_xpath('//*[@id="u"]').send_keys("輸入自己的賬號")
driver.find_element_by_xpath('//*[@id="p"]').clear()
driver.find_element_by_xpath('//*[@id="p"]').send_keys("輸入自己的密碼")
driver.find_element_by_xpath('//*[@id="login_button"]').click()

 本次實驗使用的是Jupyter進行的分段操作,如果合併代碼進行實驗應改變sleep時間,確保頁面已經更新。如有問題,歡迎批評指正,謝謝。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 除了核心功能預設內置的指令 (v-model 和 v-show),Vue 也允許註冊自定義指令。 官網介紹的比較抽象,顯得很高大上,我個人對自定義指令的理解是:當自定義指令作用在一些DOM元素或組件上時,該元素在初次渲染、插入到父節點、更新、解綁時可以執行一些特定的操作(鉤子函數() 自定義指令有兩 ...
  • 許可權系統設計 前言 許可權管理是所有後臺系統的都會涉及的一個重要組成部分,主要目的是對不同的人訪問資源進行許可權的控制,避免因許可權控制缺失或操作不當引發的風險問題,如操作錯誤,隱私數據泄露等問題。 目前在公司負責許可權這塊,所以對許可權這塊的設計比較熟悉,公司採用微服務架構,許可權系統自然就獨立出來了,其他業 ...
  • 前言 正如領域驅動設計之父 Eric Evans 所著一書的書名所述,領域驅動設計(Domain Driven Design)是一種軟體核心複雜性應對之道。 在我們解決現實業務問題時,會面對非常複雜的業務邏輯。即使是同一個事物,在多個子業務單元下代表的意思也是不完全一樣的。比如「商品」這個詞,在商品 ...
  • 自定義異常 1、繼承類 一般會選擇繼承Exception和RuntimeException,如果不要求調用者一定要處理拋出的異常,就繼承RuntimeException。 2、自定義異常類構造方法 代碼實例: People實體類 自定義異常類 測試 效果: ...
  • 異常類的繼承層次 1、Throwable是所有異常類的父類,他也繼承自Object。所以Throwable是一個類,而不是介面。 2、Error這個分支的異常是由於Java虛擬機內部錯誤導致的,如果出現了這種異常,程式員是無能為力的,因為他是java虛擬機內內部錯誤導致的。我們在程式中不需要關註他。 ...
  • JAVA Coder 的《深入分析Java Web 技術內幕》讀書筆記 ...
  • pycharm程式界面一般有很多子視窗,如圖1所示。 圖1 Pycharm子視窗 如果你發現某些子視窗不見了,圖2是最過分的情形,無須擔心。 圖2 Pycharm界面的子視窗不見了 打開項目視圖子視窗 選擇菜單“View > Tool Windows > Project”能夠打開左側的項目視圖子視窗 ...
  • 月初的時候個人網站到期了,不想再折騰重新建站了,以後還是來第三方博客寫文章吧,可以省去很多問題。之前寫的文章也不是很多,備份懶得做了,從頭開始吧。博文僅僅是用來記錄和學習總結,如有錯誤之處請幫忙指正! 今天想說說JVM記憶體結構的問題,說到JVM大家肯定首先想到的是棧和堆。的確,這兩塊說是JVM記憶體結 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...