XPath匹配標簽使用text()判斷獲取結果失敗/為空的問題及解決方法

-Advertisement-

XPath匹配標簽使用text()判斷獲取結果失敗/為空的問題及解決方法 ...

XPath當匹配標簽判斷text()判斷內容失敗的問題及解決

問題復現

在爬取網站的時候我使用XPath去抓取網頁上的內容，XPath表達式來精準獲取需要的標簽內容。

當我對如下一段html代碼編寫XPath表達式抓取的時候出現了問題，代碼如下。片名兩個字中間有七個空格，我想要獲取<dd></dd>中的內容。

<dl class="clearfloat margin-30">
    <dt>片&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;名</dt>
    <dd>愛貓之城</dd>
</dl>

我很自然地使用瞭如下的表達式。

FilmName = html.xpath('//dt[text()="色&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;彩"]/following-sibling::dd/text()')

FilmName = html.xpath('//dt[text()="色       彩"]/following-sibling::dd/text()')

但是竟然沒有獲取到。於是把轉義字元換成7個空格也是沒有用。

解決思路

我使用另一種辦法把<dt></dt>中的內容用text()抓取出來。

FilmName = html.xpath('/html/body/section[3]/div/ul/li/div[2]/ul[2]/dl[1]/dt/text()')

得到內容為：

'色\xa0\xa0\xa0\xa0\xa0\xa0\xa0彩'

這個是才意識到，在XPath中匹配的是unicode編碼的不間斷空格符（ ），所以將上面的空格全部替換為’\xa0‘即可。

FilmName = html.xpath('//dt[text()="色\xa0\xa0\xa0\xa0\xa0\xa0\xa0彩"]/following-sibling::dd/text()')

問題解決。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

SQLSEVER導出 xml文件

各種都可以參照：鏈接：https://wenku.baidu.com/view/778f794bfe4733687e21aa90.html 怎樣把SQL Server里的某個表的數據導出成XML文件，要用SQL語言，而且要自動實現，怎麼做？最佳答案 select * from 表名 for xml ...
淺談HDFS（一）

產生背景及定義 HDFS：分散式文件系統，用於存儲文件，主要特點在於其分散式，即有很多伺服器聯合起來實現其功能，集群中的伺服器各有各的角色隨著數據量越來越大，一個操作系統存不下所有的數據，那麼就分配到更多的操作系統管理的磁碟中，但是管理和維護極不方便，於是迫切需要一種系統來管理多台機器上的文件 ...
鬆軟科技web課堂:SQLServer之LEN() 函數

LEN() 函數 LEN 函數返迴文本欄位中值的長度。 SQL LEN() 語法 SQL LEN() 實例我們擁有下麵這個 "Persons" 表： IdLastNameFirstNameAddressCity 1 Adams John Oxford Street London 2 Bush Ge ...
Solr基礎知識（一）

最近接到需求，要修改網站內的搜索規則，就去看了下Solr的資料。現在做完需求了，回來做一些筆記，方便以後查找。一、安裝 1.1 配置JDK JDK下載地址為：https://www.oracle.com/technetwork/java/javase/downloads/jdk8-download ...
【面試】我是如何在面試別人Redis相關知識時“軟懟”他的

事出有因 Redis是一個分散式NoSQL資料庫，因其數據都存儲在記憶體中，所以訪問速度極快，因此幾乎所有公司都拿它做緩存使用，所以Redis常被稱為分散式緩存。一次我的一個同事讓我幫他看Redis相關的問題，我看到了他使用了Hash數據類型，其實它就對應Java里的Map。同事要往裡存十幾個key/ ...
Flutter - 生命周期

StatefulWidget 需要藉助於 State 對象，在特定的階段來處理用戶的交互或其內部數據的變化，並體現在 UI 上。這個特定的階段，就涵蓋來一個組件從載入到卸載的全過程，即生命周期。Flutter 中的 Widget 也存在生命周期，並且通過 State 來體現。而 App 則是一個特 ...
Flutter學習筆記（27）--數據共用（InheritedWidget）

InheritedWidget是Flutter中非常重要的一個功能型組件，它提供了一種數據在widget樹中從上到下傳遞、共用的方式，比如我們在應用的根widget中通過InheritedWidget共用了一個數據，那麼我們便可以在任意子widget中來獲取該共用的數據。 ...
《垃圾分類小助手-生活的好幫手-技術支持》

垃圾分類小助手-生活的好幫手的技術支持，如果您使用中出現什麼問題或者對我們產品有什麼改進建議，請隨時與我聯繫。電話：15990075212 郵箱：[email protected] 應用簡介垃圾分類小助手-生活的好幫手能夠快速搜索垃圾分類，高效率識別垃圾分類，輕鬆解決垃圾分類難題 ...