女同桌找我要表情包,還好我會Python,分分鐘給她下載幾十個G...

来源:https://www.cnblogs.com/hahaa/archive/2022/09/14/16694439.html
-Advertisement-
Play Games

emmm~ 起因呢,這昨晚女同桌跟我說電腦有點卡,喊我去宿舍給她裝個新系統,裝系統就裝系統吧,結果又說新系統表情包都沒保存~ 我當時就有點生氣,真當我是萬能的呢? 於是我直接就用Python給她爬了幾十個G,完事扭頭就走,任她怎麼喊我也沒用! 一、準備工作 使用的環境 python3.8 | Ana ...


emmm~

起因呢,這昨晚女同桌跟我說電腦有點卡,喊我去宿舍給她裝個新系統,裝系統就裝系統吧,結果又說新系統表情包都沒保存~

我當時就有點生氣,真當我是萬能的呢?

於是我直接就用Python給她爬了幾十個G,完事扭頭就走,任她怎麼喊我也沒用!

在這裡插入圖片描述

一、準備工作

使用的環境

  • python3.8 | Anaconda
  • pycharm

使用的模塊

  • requests 第三方模塊 需要手動安裝
  • re 內置模塊不需要安裝

win+r 輸入cmd ,確定後新視窗輸入 pip install requests 即可安裝成功。

插件安裝

xpath helper擴展工具包

安裝步驟:找助理老師獲取xpath helper擴展工具包(註意:不要解壓)
》》 打開Google瀏覽器 --> 更多工具 --> 擴展程式 --> 打開開發者模式 --> 把xpath helper擴展工具包直接拖入 --> 刷新
使用方法:快捷鍵 ctrl+shift+X

思路流程

1、分析數據來源
第一頁:https://fabiaoqing.com/biaoqing/lists/page/1.html
多頁 —> 第一頁 --> 一個
2、實現代碼

  • 發送請求,第一頁數據
  • 獲取數據
  • 解析數據,表情
  • 保存數據

二、效果展示

部分效果展示

三、代碼解析

1、發送請求

第一頁數據

url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'
headers = {
    # 鍵值對  用戶代理   瀏覽器的基本身份
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
response = requests.get(url, headers=headers)


# <Response [200]>  響應對象   200 狀態  成功  404  403
print(response)

 

2、獲取數據

網頁源代碼

print(response.text)

 

re 找規律

3、解析數據

.*? 精準匹配數據

re_data = re.findall('<img class="ui image lazy" data-original="(.*?)" src="/Public/lazyload/img/transparent.gif" title="(.*?)" ', response.text)
# print(re_data)

# for 迴圈
for img in re_data:
    # print(img)
    #索引 [0]  [1] ()
    # 單個表情包鏈接
    link = img[0]
    suffix = link.split('.')[-1]
    # print(suffix)
    # print(link)
    # 名字
    title = img[1]
    title = re.sub(r'[\/:*?"<>|]','',title)
    # 二進位
    content = requests.get(link, headers=headers).content
    # print(content)

 

4、保存數據

with open('表情包\\' + title +'.' +suffix, mode='wb') as file:
    file.write(content)
# 我也錄製了對應的視頻詳細講解,完整代碼和視頻都放在這個裙了 279199867

 

好了,今天的分享就到這裡~

最後給大家分享一套Python教程:Python實戰100例,希望對大家有所幫助!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 什麼是統一建模語言,來看看百科中的介紹統一建模語言(Unified Modeling Language,UML)是一種為面向對象系統的產品進行說明、可視化和編製文檔的一種標準語言,是非專利的第三代建模和規約語言。UML是面向對象設計的建模工具,獨立於任何具體程式設計語言。簡單來說UML就是脫離於具體 ...
  • 在日常生產生活中,我們常說,“安全第一”、“安全無小事”。圍繞著安全問題,在各行各業都有對各類常見安全問題的解決方案和突發安全問題的應急預案。在互聯網、軟體開發領域,我們日常工作中對各類常見的安全問題又有哪些常見的解決方案呢?在此,結合經典架構圖做一個梳理。 ...
  • Django_render 模板語法 模板引擎是一種可以讓開發者把服務端數據填充到html網頁中完成渲染效果的技術。它實現了把前端代碼和服務端代碼分離的作用,讓項目中的業務邏輯代碼和數據表現代碼分離,讓前端開發者和服務端開發者可以更好的完成協同開發。 靜態網頁:頁面上的數據都是寫死的,萬年不變 動態 ...
  • 目錄 一.嵌入式設備的 OpenGL ES 版本 二.相容性 三.著色器腳本 1.OpenGL ES shader 2.0 2.OpenGL ES shader 3.0 3.版本聲明 4. 預設精度修飾符 precision 4.輸入輸出 5.變數賦值 四.關於頂點緩衝區對象 VBO 與頂點數組對象 ...
  • 一、什麼是使用註解開發 使用註解開發就是無需再配置Mapper.xml文件,直接在介面中利用註解實現SQL語句。 二、為什麼要使用註解開發 正如官方文檔所說: 使用註解來映射簡單語句會使代碼顯得更加簡潔。 但對於稍微複雜一點的語句,Java 註解不僅力不從心,還會讓你本就複雜的 SQL 語句更加混亂 ...
  • Java坦克大戰06 8.IO流應用01 坦克大戰6.0版 增加功能: 防止敵人坦克重疊運動 記錄玩家的成績(累計擊毀坦克數),存檔退出 記錄當時的敵人坦克坐標,存檔退出 玩游戲時,可以選擇是開新游戲還是繼續上局游戲 8.1防止敵人坦克重疊運動 8.1.1思路分析 按照目標坦克的向右下左四種情況分析 ...
  • 第一篇:電腦的基礎知識 編程語言的介紹 電腦介紹和五大組成 平臺與軟體跨平臺介紹 CS、BS架構和網路通信協議 操作系統的介紹 cpu詳解 存儲器詳解 操作系統啟動流程和BIOS介紹 第二篇:python環境的搭建 python介紹和解釋器的安裝(暫略) python程式的運行方式和步驟 集成開 ...
  • 首先,先看一下intern方法(JDK1.8)的官方文檔: 全是英文,閱讀起來有點困難怎麼辦?沒關係,博主對此做了翻譯: 返回字元串對象的規範表示形式。 最初為空的字元串池由類字元串私人維護。 調用intern方法時,如果池中已包含一個字元串,該字元串等於由equals(object)方法確定的該字 ...
一周排行
    -Advertisement-
    Play Games
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 本章將和大家分享ES的數據同步方案和ES集群相關知識。廢話不多說,下麵我們直接進入主題。 一、ES數據同步 1、數據同步問題 Elasticsearch中的酒店數據來自於mysql資料庫,因此mysql數據發生改變時,Elasticsearch也必須跟著改變,這個就是Elasticsearch與my ...
  • 引言 在我們之前的文章中介紹過使用Bogus生成模擬測試數據,今天來講解一下功能更加強大自動生成測試數據的工具的庫"AutoFixture"。 什麼是AutoFixture? AutoFixture 是一個針對 .NET 的開源庫,旨在最大程度地減少單元測試中的“安排(Arrange)”階段,以提高 ...
  • 經過前面幾個部分學習,相信學過的同學已經能夠掌握 .NET Emit 這種中間語言,並能使得它來編寫一些應用,以提高程式的性能。隨著 IL 指令篇的結束,本系列也已經接近尾聲,在這接近結束的最後,會提供幾個可供直接使用的示例,以供大伙分析或使用在項目中。 ...
  • 當從不同來源導入Excel數據時,可能存在重覆的記錄。為了確保數據的準確性,通常需要刪除這些重覆的行。手動查找並刪除可能會非常耗費時間,而通過編程腳本則可以實現在短時間內處理大量數據。本文將提供一個使用C# 快速查找並刪除Excel重覆項的免費解決方案。 以下是實現步驟: 1. 首先安裝免費.NET ...
  • C++ 異常處理 C++ 異常處理機制允許程式在運行時處理錯誤或意外情況。它提供了捕獲和處理錯誤的一種結構化方式,使程式更加健壯和可靠。 異常處理的基本概念: 異常: 程式在運行時發生的錯誤或意外情況。 拋出異常: 使用 throw 關鍵字將異常傳遞給調用堆棧。 捕獲異常: 使用 try-catch ...
  • 優秀且經驗豐富的Java開發人員的特征之一是對API的廣泛瞭解,包括JDK和第三方庫。 我花了很多時間來學習API,尤其是在閱讀了Effective Java 3rd Edition之後 ,Joshua Bloch建議在Java 3rd Edition中使用現有的API進行開發,而不是為常見的東西編 ...
  • 框架 · 使用laravel框架,原因:tp的框架路由和orm沒有laravel好用 · 使用強制路由,方便介面多時,分多版本,分文件夾等操作 介面 · 介面開發註意欄位類型,欄位是int,查詢成功失敗都要返回int(對接java等強類型語言方便) · 查詢介面用GET、其他用POST 代碼 · 所 ...
  • 正文 下午找企業的人去鎮上做貸後。 車上聽同事跟那個司機對罵,火星子都快出來了。司機跟那同事更熟一些,連我在內一共就三個人,同事那一手指桑罵槐給我都聽愣了。司機也是老社會人了,馬上聽出來了,為那個無辜的企業經辦人辯護,實際上是為自己辯護。 “這個事情你不能怪企業。”“但他們總不能讓銀行的人全權負責, ...
  • 1. JUnit 最佳實踐指南 原文: https://howtodoinjava.com/best-practices/unit-testing-best-practices-junit-reference-guide/ 我假設您瞭解 JUnit 的基礎知識。 如果您沒有基礎知識,請首先閱讀(已針 ...