selenium-獲取一組數組進行操作

-Advertisement-

selenium-獲取一組數組進行操作以縱橫中文網中獲取24小時暢銷榜的書單為例此文僅做 selenium 在自動化測試中怎麼獲取一組數據進行說明，不做網路爬蟲解釋當然，使用爬蟲得到本文的結果會簡單快捷的多區別 selenium 中的 elements 與 element 例如：list ...

selenium-獲取一組數組進行操作

　　以縱橫中文網中獲取24小時暢銷榜的書單為例

　　此文僅做 selenium 在自動化測試中怎麼獲取一組數據進行說明，不做網路爬蟲解釋

　　當然，使用爬蟲得到本文的結果會簡單快捷的多

區別 selenium 中的 elements 與 element

　　例如：list.find_elements_by_class_name('rank_i_bname') # 獲得 class name 為 rank_i_bname 的所有數據

　　　　　list.find_element_by_class_name('rank_i_p_tit') # # 獲得 class name 為 rank_i_p_tit 的一個數據，如果有多個則只取第一個

步驟：

　　使用 selenium 定位到總分類

　　然後通過判斷24小時暢銷榜，進入到24小時暢銷榜的書目錄

　　最後獲得書名和作者

如下圖

代碼如下：

 1 #coding=utf-8
 2 
 3 from selenium import webdriver
 4 import unittest
 5 
 6 
 7 class getListall(unittest.TestCase):
 8 
 9     def setUp(self):
10 
11         # 縱橫小說中文網
12         base_url = 'http://book.zongheng.com/rank.html'
13         self.driver = webdriver.Chrome()
14         self.driver.implicitly_wait(10)
15         self.driver.get(base_url)
16 
17     def test_get_list_all(self):
18         u"""獲取數組"""
19         driver = self.driver
20         # 獲取所有分類
21         lists = driver.find_elements_by_class_name('rank_i_p_list')
22         for list in lists:
23             # 獲取24小時暢銷榜下的書
24             if list.find_element_by_class_name('rank_i_p_tit').text == "24小時暢銷榜":
25 
26                 # 獲取書
27                 names = list.find_elements_by_class_name('rank_i_bname')
28                 authors = list.find_elements_by_class_name('rank_i_bcount')
29 
30                 # 列印獲取的數據
31                 for name,author in zip(names,authors):
32                    print(name.text + "，" + author.text + "；")
33 
34 
35     def tearDown(self):
36         self.driver.quit()
37 
38 
39 if __name__ == '__main__':
40     unittest.main()

運行結果

結果分析

　　分析結果會發現，第一個書單所獲取的信息和其他的書單信息不一致

　　原因：查看網頁html便可知

　　class=“rank_i_bname” 下的 text ，第一個書單和其他書單的信息是不一樣的

如果看起來不美觀可以將第一個書單提取處理單獨進行定位獲取信息進行列印

　　　　然後在 for 迴圈中將獲取到的書單的第一個信息不要列印

　　　　問題解決

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

20190110-生成密碼以及簡易密碼強度檢查

1.生成9位字母的密碼使用random.choice函數，此函數需要一個序列，因此給定一個序列包含a-z，A-Z 2：生成9位數字和字母的密碼，密碼可能隨機出現數字和字母此題在上一題的基礎上先生成一個序列包含所有字母和數字，然後使用random.choice()函數 3.檢測密碼強度 c1 : 長 ...
Django 系列博客（七）

Django 系列博客（七）前言本篇博客介紹 Django 中的視圖層中的相關參數，HttpRequest 對象、HttpResponse 對象、JsonResponse，以及視圖層的兩種響應方式 CBV 和 FBV，還有簡單的文件上傳。視圖函數一個視圖函數，簡稱視圖，是一個簡單的Pytho ...
SSM的搭建

1.首先是工具的準備。 2.工具環境的搭建首先，new建立選擇maven project工程，勾選simple project,next後如下圖所示，goup id起名為com.blog,artifact id為ssm-build,packing為war。點擊finish後完成maven工程的創 ...
AbstractList 重寫 equals() 方法

題目內容題目內容很簡單，就是創建 ArrayList 和 Vector 集合，向兩者添加相同內容的字元串，最後用 equals() 方法比較是否相等。這裡就考察了 "==" 和 equals() 方法的知識點。這裡我最開始以為輸出為 false，但實驗了一下，結果為 true！為什麼呢？因為 ...
Java 控制類的引用類型，合理使用記憶體

Java提供了 java.lang.ref包,該包下的類均與垃圾回收機制相關先介紹Java對象的集中引用類型 1.強引用強引用是最常見的,創建對象就是強引用,如 String a = new String("1"); 無論系統記憶體是否緊張,只要該對象還存在強引用就不會被垃圾回收機制回收 2.軟引 ...
多線程系列之線程安全

序言：提到線程安全，可能大家首先想到的是確保介面對共用變數的操作要具備原子性。實際上，在多線程編程中我們需要同時關註可見性，順序性和原子性。本篇文章將從這三個問題出發，結合實例詳解volatile如何保u證可見性及一定程式上保證順序性，同時例講synchronized如何同時保證可見性和原子性，最 ...
Python 推薦書單

以下書籍都是本人看過的書籍，僅做參考。個人推薦一本一本看，不要跨級，步子大了容易扯著dan。《電腦科學導論》本人靠這本書入門電腦，也許談不上入門《網路是怎樣連接的》《電腦組成原理》《電腦操作系統》這四本不用多說，電腦基礎中的基礎，不說要全部記住，至少要一目十行看完這三大本，對計算 ...
Perl一行式：選擇行輸出、刪除、追加、插入

perl一行式程式系列文章： "Perl一行式" 對於Perl的一行式perl程式來說，選擇要輸出的、要刪除的、要插入/追加的行是非常容易的事情，因為print/say決定行是否輸出/插入/追加/刪除。雖然簡單，但對於廣泛應用在sed的示例還是可以拿到這裡來討論一番。因為輸出/刪除/插入/追加行 ...