python爬蟲beautifulsoup4系列1

来源:https://www.cnblogs.com/king8/archive/2018/12/06/10079336.html
-Advertisement-
Play Games

前言 以博客園為例,爬取我的博客上首頁的發佈時間、標題、摘要,本篇先小試牛刀,先瞭解下它的強大之處,後面講beautifulsoup4的詳細功能。   一、安裝 1.打開cmd用pip線上安裝beautifulsoup4 >pip install beautifulsoup4 &nb ...


前言

以博客園為例,爬取我的博客上首頁的發佈時間、標題、摘要,本篇先小試牛刀,先瞭解下它的強大之處,後面講beautifulsoup4的詳細功能。

 

一、安裝

1.打開cmd用pip線上安裝beautifulsoup4

>pip install beautifulsoup4

 

二、解析器

1.我們主要用第一個html.parser,這個是python的標準庫,可以直接用。其它幾個需要安裝對應解析器,

下表列出了主要的解析器,以及它們的優缺點:

 

三、列印首頁博客的時間

1.這裡直接定位不好定位到,可以先定位它的父元素:class="dayTitle"


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 我們都見識過requests庫在靜態網頁的爬取上展現的威力,我們日常見得最多的為get和post請求,他們最大的區別在於安全性上: 1、GET是通過URL方式請求,可以直接看到,明文傳輸。 2、POST是通過請求header請求,可以開發者工具或者抓包可以看到,同樣也是明文的。 3.GET請求會保存 ...
  • 題意 "題目鏈接" Sol 好好讀題 = 送分題 不好好讀題 = 送命題 開始想了$30$min數據結構發現根本不會做,重新讀了一遍題發現是個傻逼題。。。 $C_{i, j} = a[i] b[j]$ 根據乘法分配律,題目就變成了在數組$a, b$中分別選一段連續的區間,要求權值和相乘$ defin ...
  • 1.運行時控制Nginx進程 NGINX有一個主進程和一個或多個工作進程。 如果啟用了緩存,則緩存載入器和緩存管理器進程也會在啟動時運行。 主進程的主要目的是讀取和評估配置文件,以及維護工作進程。 工作進程執行請求的實際處理。 NGINX依賴於依賴操作系統的機制來有效地在工作進程之間分配請求。 工作... ...
  • 卡拉茲(Callatz)猜想: 卡拉茲(Callatz)猜想: 卡拉茲(Callatz)猜想: 對任何一個正整數 n,如果它是偶數,那麼把它砍掉一半;如果它是奇數,那麼把 (3n+1) 砍掉一半。這樣一直反覆砍下去,最後一定在某一步得到 n=1。卡拉茲在 1950 年的世界數學家大會上公佈了這個猜想 ...
  • 我走過最長的路是你的套路 女:二號男嘉賓,假如我們牽手成功後,你會買名牌包包給我嗎? 男:那你會聽話嗎? 女:會 聽話。 男:聽話 咱不買! 那麼消息隊列MQ有什麼套路呢?(這個話題轉換生硬度連我自己都怕!) 1.消息隊列的應用場景和好處: 非同步-流量削峰 非同步-流量削峰 我們先來看下傳統的伺服器接 ...
  • 什麼是函數 函數是對功能或者動作的封裝 函數的語法和定義 define 定義 def 函數名(): 函數體 調用: 函數名() def yue(): # 描述你的動作 print("拿出手機") print('打開陌陌') print("找一個心儀的小姐姐") print('有沒有時間啊, 聊聊人生 ...
  • 電腦的編程語言類型:編譯型,解釋型 java正是這兩種類型的結合: (1)編輯器編寫java源程式→源文件名:主類名.java (2)將源程式編譯為位元組碼→:位元組碼文件 : 源文件.class (3)利用虛擬機解釋執行。運行過程:載入、代碼校驗、解釋執行 ...
  • 1. 什麼是函數? f(x) = x + 1 y = x + 1 函數是對功能或者動作的封裝 2. 函數的語法和定義 3. 關於函數的返回值 return : 返回 1. 當程式沒寫過return, 不返回任何結果. 如果你非要接收. 接受到的是None 2. 當函數寫return 值, 有一個返回 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...