Python+Selenium筆記（一）：環境配置+簡單的例子

-Advertisement-

#環境配置基於windows操作系統（一）環境配置（1）執行下麵的命令（前提：已經安裝python環境，可以參考之前發的python筆記（一）） pip install -U selenium （2）http://docs.seleniumhq.org/download/ （網站打不開的話就翻 ...

#環境配置基於windows操作系統

#學習selenium要有一些HTML和xpth的基礎，完全不會的建議先花點時間學點基礎（不然元素定位，特別是xpth可能看的有點懵）

#HTML : http://www.runoob.com/html/ #xpth: http://www.runoob.com/xpath

（一） 環境配置

（1）執行下麵的命令（前提：已經安裝python環境，可以參考之前發的python筆記（一））

pip install -U selenium

（2）http://docs.seleniumhq.org/download/ （網站打不開的話就FQ）

去下載Mozilla GeckoDriver（因為我暫時用火狐測試，所以下載這個），解壓後放到任意目錄下，然後在系統變數path中加上解壓後的路徑（我在2臺電腦上試了下，一個放在任意目錄，一個放到python的安裝目錄，反正都能用。）

（3）之後如果創建瀏覽器驅動實例還是報錯的話（可能是瀏覽器版本的問題，我python3.6+selenium3.9+火狐47+Mozilla GeckoDriverV0.19.1就報錯，火狐換成58就不會了）

（二） 簡單的例子

#導入webdriver
from selenium import webdriver
#FirefoxBinary--導入2進位文件所在的位置
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
#指定火狐瀏覽器的二進位路徑
firefox = FirefoxBinary(r"C:\Program Files (x86)\Mozilla Firefox\firefox.exe")
driver = webdriver.Firefox(firefox_binary=firefox) #創建火狐瀏覽器的驅動實例

driver.implicitly_wait(2) #設置等待時間（定義執行步驟的超時時間）
driver.maximize_window() #最大化瀏覽器

driver.get("https://www.cnblogs.com/") #打開博客園首頁
search_field = driver.find_element_by_id('zzk_q') #通過id定位博客園首頁的搜索框
search_btn =driver.find_element_by_class_name('search_btn') #通過class定位博客園首頁的查詢按鈕

search_field.clear() #清空搜索框的值（如果有）
search_field.send_keys("python") #在搜索框中輸入查詢條件
search_btn.click() #點擊查詢按鈕
# search_field.submit()
#選取<h3><a>開始，</a>結束之間的值，返回一個列表
products = driver.find_elements_by_xpath('//h3[a/@target="_blank"]/a')
#迭代列表products，輸出text的值
for p in products:
print(p.text)
#選取<a target="_blank">節點的值，返回一個列表
pro = driver.find_elements_by_xpath('//h3/a[@target="_blank"]')
#迭代輸出href屬性的值
for p in pro:
print(p.get_attribute('href'))
#關閉瀏覽器
driver.quit()

（三） 輸出如下

第二步驟中的xpth其實主要定位的就是下麵這些

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

[C#]設計模式-建造者模式-創建型模式

介紹完工廠模式，現在來看一下建造者模式。建造者模式就是將一系列對象組裝為一個完整對象並且返回給用戶，例如汽車，就是需要由各個部件來由工人建造成一個複雜的組合實體，這個複雜實體的構造過程就被外部化到一個建造者的對象，由這個建造者對象返回創建好的實體，是不是跟工廠很像呀？建造者模式則主要由幾個對象構成 ...
給OkHttp Client添加socks代理

Okhttp的使用沒有httpClient廣泛，網上關於Okhttp設置代理的方法很少，這篇文章完整介紹了需要註意的方方面面。上一篇博客中介紹了socks代理的入口是創建時傳入一個對象。 OkHttp client通過創建，可以通過定製和`java.net.SocketFactory`來實 ...
給HttpClient添加Socks代理

本文描述http client使用socks代理過程中需要註意的幾個方面：1，socks5支持用戶密碼授權；2，支持https；3，支持讓代理伺服器解析DNS；使用代理創建Socket 從原理上來看，不管用什麼http客戶端（httpclient，okhttp），最終都要轉換到的創建上去，看到代 ...
java crm 系統進銷存 springmvc SSM項目項目源碼

統介紹： 1.系統採用主流的 SSM 框架 jsp JSTL bootstrap html5 (PC瀏覽器使用) 2.springmvc +spring4.3.7+ mybaits3.3 SSM 普通java web（非maven, 附贈pom.xml文件）資料庫：mysql 3.開發工具：mye ...
軟體架構系列二：Clean架構

外圈的層次可以依賴內層，反之不可以；內圈核心的實體代表業務，不可以依賴其所處的技術環境。這是著名軟體大師Bob大叔提出的一種架構，也是當前各種語言開發架構。乾凈架構提出了一種單向依賴關係，從而在邏輯上形成一種向上的抽象系統。這種乾凈的架構圖如下：依賴規則Dependency Rule 上圖中同 ...
軟體架構系列一：C4模型

本文要點預覽：因為軟體系統的分散式特點以及開發團隊的分佈性，瞭解軟體架構的基礎變得越來越重要。而在過度設計和毫無設計之間，我們應該把註意力放在對軟體系統有重大影響的決策和權衡上。好的架構師應該是團隊的活躍分子，不僅能夠進行代碼協作，還能為團隊提供技術指導。軟體架構中的溝通環節極具挑戰性。C4 模型對 ...
微服務架構--編程過程中的不變與萬變

We are in the changing world , exspecially in interenet,more and more developing structure appeared in latest years from MVC to SOA ,from SOA to Micro ...
ORM一些知識點

ORM的特點之一是：把表映射成類，把行作為實例，把欄位作為屬性。 ...