一、 1.下載安裝chrome+chrome driver 2.selenium操作主要分為兩類: (1)得到UI元素 find_element_by_id:通過id值來獲取元素 find_elements_by_name(下麵都同理) find_elements_by_xpath find_el ...
一、
1.下載安裝chrome+chrome driver
2.selenium操作主要分為兩類:
(1)得到UI元素
find_element_by_id:通過id值來獲取元素
find_elements_by_name(下麵都同理)
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector
(2)基於UI元素操作的模擬
單擊;右鍵;拖拽;輸入;可以通過導入ActionChains類來做到
from selenium import webdriver from selenium.webdriver.common.keys import Keys#導入的鍵盤 import time #可能需要手動添加路徑 chromedriverAddress = r"C:\Users\lenovo1\AppData\Local\Programs\Python\Python37\Lib\site-packages\selenium\webdriver\chrome\chromedriver.exe" driver = webdriver.Chrome(executable_path=chromedriverAddress) #寫這一行的時候報錯了,可見這裡配置:https://blog.csdn.net/weixin_43746433/article/details/95237254 url = "http://www.baidu.com" driver.get(url) text1 = driver.find_element_by_id("wrapper").text#得到這個元素的值 print(text1) print(driver.title) #得到頁面的快照 driver.save_screenshot("index,png") driver.find_element_by_id("kw").send_keys(u"大熊貓")#向這個id輸入“大熊貓”(實際上這裡的kw的id就是查找的欄位) driver.find_element_by_id("su").click()#點擊操作(實際上就是上一步鍵入信息,下一步我們進行檢索) time.sleep(5) driver.save_screenshot("daxiongmao.png") #獲取當前界面的cookie print(driver.get_cookies()) #模擬輸入兩個按鍵ctrl+a driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'a') #模擬ctrl + x,剪切操作 driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'x') driver.find_element_by_id("kw").send_keys(u"航空母艦") driver.save_screenshot("hangmu.png") driver.find_element_by_id("su").send_keys(Keys.RETURN) time.sleep(5) driver.save_screenshot("hangmu2.png") #清空輸入框,clear driver.find_element_by_id("kw").clear() #關閉瀏覽器 driver.quit()
二、驗證碼問題
1.驗證碼最大的作用就是用於判斷訪問者是機器人還是真人,可以分為:見到那圖片;極驗(官網:www.geetest.com);12306;電話報驗證碼;google驗證;
2.驗證碼破解:
(1)通用方法:下載網頁和驗證碼;手動輸入驗證號碼/
(2)簡單圖片:使用圖像識別軟體識別軟體;可以使用第三方圖像驗證碼破解網站
三、源碼
Reptile15_1_DHtmlChrome.py
https://github.com/ruigege66/PythonReptile/blob/master/Reptile15_1_DHtmlChrome.py
2.CSDN:https://blog.csdn.net/weixin_44630050
3.博客園:https://www.cnblogs.com/ruigege0000/
4.歡迎關註微信公眾號:傅里葉變換,個人公眾號,僅用於學習交流,後臺回覆”禮包“,獲取大數據學習資料