女同桌找我要表情包,還好我會Python,分分鐘給她下載幾十個G...

来源:https://www.cnblogs.com/hahaa/archive/2022/09/14/16694439.html
-Advertisement-
Play Games

emmm~ 起因呢,這昨晚女同桌跟我說電腦有點卡,喊我去宿舍給她裝個新系統,裝系統就裝系統吧,結果又說新系統表情包都沒保存~ 我當時就有點生氣,真當我是萬能的呢? 於是我直接就用Python給她爬了幾十個G,完事扭頭就走,任她怎麼喊我也沒用! 一、準備工作 使用的環境 python3.8 | Ana ...


emmm~

起因呢,這昨晚女同桌跟我說電腦有點卡,喊我去宿舍給她裝個新系統,裝系統就裝系統吧,結果又說新系統表情包都沒保存~

我當時就有點生氣,真當我是萬能的呢?

於是我直接就用Python給她爬了幾十個G,完事扭頭就走,任她怎麼喊我也沒用!

在這裡插入圖片描述

一、準備工作

使用的環境

  • python3.8 | Anaconda
  • pycharm

使用的模塊

  • requests 第三方模塊 需要手動安裝
  • re 內置模塊不需要安裝

win+r 輸入cmd ,確定後新視窗輸入 pip install requests 即可安裝成功。

插件安裝

xpath helper擴展工具包

安裝步驟:找助理老師獲取xpath helper擴展工具包(註意:不要解壓)
》》 打開Google瀏覽器 --> 更多工具 --> 擴展程式 --> 打開開發者模式 --> 把xpath helper擴展工具包直接拖入 --> 刷新
使用方法:快捷鍵 ctrl+shift+X

思路流程

1、分析數據來源
第一頁:https://fabiaoqing.com/biaoqing/lists/page/1.html
多頁 —> 第一頁 --> 一個
2、實現代碼

  • 發送請求,第一頁數據
  • 獲取數據
  • 解析數據,表情
  • 保存數據

二、效果展示

部分效果展示

三、代碼解析

1、發送請求

第一頁數據

url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'
headers = {
    # 鍵值對  用戶代理   瀏覽器的基本身份
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
response = requests.get(url, headers=headers)


# <Response [200]>  響應對象   200 狀態  成功  404  403
print(response)

 

2、獲取數據

網頁源代碼

print(response.text)

 

re 找規律

3、解析數據

.*? 精準匹配數據

re_data = re.findall('<img class="ui image lazy" data-original="(.*?)" src="/Public/lazyload/img/transparent.gif" title="(.*?)" ', response.text)
# print(re_data)

# for 迴圈
for img in re_data:
    # print(img)
    #索引 [0]  [1] ()
    # 單個表情包鏈接
    link = img[0]
    suffix = link.split('.')[-1]
    # print(suffix)
    # print(link)
    # 名字
    title = img[1]
    title = re.sub(r'[\/:*?"<>|]','',title)
    # 二進位
    content = requests.get(link, headers=headers).content
    # print(content)

 

4、保存數據

with open('表情包\\' + title +'.' +suffix, mode='wb') as file:
    file.write(content)
# 我也錄製了對應的視頻詳細講解,完整代碼和視頻都放在這個裙了 279199867

 

好了,今天的分享就到這裡~

最後給大家分享一套Python教程:Python實戰100例,希望對大家有所幫助!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 什麼是統一建模語言,來看看百科中的介紹統一建模語言(Unified Modeling Language,UML)是一種為面向對象系統的產品進行說明、可視化和編製文檔的一種標準語言,是非專利的第三代建模和規約語言。UML是面向對象設計的建模工具,獨立於任何具體程式設計語言。簡單來說UML就是脫離於具體 ...
  • 在日常生產生活中,我們常說,“安全第一”、“安全無小事”。圍繞著安全問題,在各行各業都有對各類常見安全問題的解決方案和突發安全問題的應急預案。在互聯網、軟體開發領域,我們日常工作中對各類常見的安全問題又有哪些常見的解決方案呢?在此,結合經典架構圖做一個梳理。 ...
  • Django_render 模板語法 模板引擎是一種可以讓開發者把服務端數據填充到html網頁中完成渲染效果的技術。它實現了把前端代碼和服務端代碼分離的作用,讓項目中的業務邏輯代碼和數據表現代碼分離,讓前端開發者和服務端開發者可以更好的完成協同開發。 靜態網頁:頁面上的數據都是寫死的,萬年不變 動態 ...
  • 目錄 一.嵌入式設備的 OpenGL ES 版本 二.相容性 三.著色器腳本 1.OpenGL ES shader 2.0 2.OpenGL ES shader 3.0 3.版本聲明 4. 預設精度修飾符 precision 4.輸入輸出 5.變數賦值 四.關於頂點緩衝區對象 VBO 與頂點數組對象 ...
  • 一、什麼是使用註解開發 使用註解開發就是無需再配置Mapper.xml文件,直接在介面中利用註解實現SQL語句。 二、為什麼要使用註解開發 正如官方文檔所說: 使用註解來映射簡單語句會使代碼顯得更加簡潔。 但對於稍微複雜一點的語句,Java 註解不僅力不從心,還會讓你本就複雜的 SQL 語句更加混亂 ...
  • Java坦克大戰06 8.IO流應用01 坦克大戰6.0版 增加功能: 防止敵人坦克重疊運動 記錄玩家的成績(累計擊毀坦克數),存檔退出 記錄當時的敵人坦克坐標,存檔退出 玩游戲時,可以選擇是開新游戲還是繼續上局游戲 8.1防止敵人坦克重疊運動 8.1.1思路分析 按照目標坦克的向右下左四種情況分析 ...
  • 第一篇:電腦的基礎知識 編程語言的介紹 電腦介紹和五大組成 平臺與軟體跨平臺介紹 CS、BS架構和網路通信協議 操作系統的介紹 cpu詳解 存儲器詳解 操作系統啟動流程和BIOS介紹 第二篇:python環境的搭建 python介紹和解釋器的安裝(暫略) python程式的運行方式和步驟 集成開 ...
  • 首先,先看一下intern方法(JDK1.8)的官方文檔: 全是英文,閱讀起來有點困難怎麼辦?沒關係,博主對此做了翻譯: 返回字元串對象的規範表示形式。 最初為空的字元串池由類字元串私人維護。 調用intern方法時,如果池中已包含一個字元串,該字元串等於由equals(object)方法確定的該字 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...