女同桌找我要表情包，還好我會Python，分分鐘給她下載幾十個G...

-Advertisement-

emmm~ 起因呢，這昨晚女同桌跟我說電腦有點卡，喊我去宿舍給她裝個新系統，裝系統就裝系統吧，結果又說新系統表情包都沒保存~ 我當時就有點生氣，真當我是萬能的呢？於是我直接就用Python給她爬了幾十個G，完事扭頭就走，任她怎麼喊我也沒用！一、準備工作使用的環境 python3.8 | Ana ...

emmm~

起因呢，這昨晚女同桌跟我說電腦有點卡，喊我去宿舍給她裝個新系統，裝系統就裝系統吧，結果又說新系統表情包都沒保存~

我當時就有點生氣，真當我是萬能的呢？

於是我直接就用Python給她爬了幾十個G，完事扭頭就走，任她怎麼喊我也沒用！

在這裡插入圖片描述

一、準備工作

使用的環境

python3.8 | Anaconda
pycharm

使用的模塊

requests 第三方模塊需要手動安裝
re 內置模塊不需要安裝

win+r 輸入cmd ，確定後新視窗輸入 pip install requests 即可安裝成功。

插件安裝

xpath helper擴展工具包

安裝步驟：找助理老師獲取xpath helper擴展工具包（註意：不要解壓）
》》打開Google瀏覽器 --> 更多工具 --> 擴展程式 --> 打開開發者模式 --> 把xpath helper擴展工具包直接拖入 --> 刷新
使用方法：快捷鍵 ctrl+shift+X

思路流程

1、分析數據來源
第一頁:https://fabiaoqing.com/biaoqing/lists/page/1.html
多頁 —> 第一頁 --> 一個
2、實現代碼

發送請求,第一頁數據
獲取數據
解析數據,表情
保存數據

二、效果展示

部分效果展示

三、代碼解析

1、發送請求

第一頁數據

url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'
headers = {
    # 鍵值對  用戶代理   瀏覽器的基本身份
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
response = requests.get(url, headers=headers)


# <Response [200]>  響應對象   200 狀態  成功  404  403
print(response)

2、獲取數據

網頁源代碼

print(response.text)

re 找規律

3、解析數據

.*? 精準匹配數據

re_data = re.findall('<img class="ui image lazy" data-original="(.*?)" src="/Public/lazyload/img/transparent.gif" title="(.*?)" ', response.text)
# print(re_data)

# for 迴圈
for img in re_data:
    # print(img)
    #索引 [0]  [1] ()
    # 單個表情包鏈接
    link = img[0]
    suffix = link.split('.')[-1]
    # print(suffix)
    # print(link)
    # 名字
    title = img[1]
    title = re.sub(r'[\/:*?"<>|]','',title)
    # 二進位
    content = requests.get(link, headers=headers).content
    # print(content)

4、保存數據

with open('表情包\\' + title +'.' +suffix, mode='wb') as file:
    file.write(content)
# 我也錄製了對應的視頻詳細講解，完整代碼和視頻都放在這個裙了 279199867

好了，今天的分享就到這裡~

最後給大家分享一套Python教程：Python實戰100例，希望對大家有所幫助！

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

統一建模語言UML---類圖

什麼是統一建模語言，來看看百科中的介紹統一建模語言(Unified Modeling Language，UML)是一種為面向對象系統的產品進行說明、可視化和編製文檔的一種標準語言，是非專利的第三代建模和規約語言。UML是面向對象設計的建模工具，獨立於任何具體程式設計語言。簡單來說UML就是脫離於具體 ...
從系統架構分析安全問題及應對措施

在日常生產生活中，我們常說，“安全第一”、“安全無小事”。圍繞著安全問題，在各行各業都有對各類常見安全問題的解決方案和突發安全問題的應急預案。在互聯網、軟體開發領域，我們日常工作中對各類常見的安全問題又有哪些常見的解決方案呢？在此，結合經典架構圖做一個梳理。 ...
Django_渲染詳解

Django_render 模板語法模板引擎是一種可以讓開發者把服務端數據填充到html網頁中完成渲染效果的技術。它實現了把前端代碼和服務端代碼分離的作用，讓項目中的業務邏輯代碼和數據表現代碼分離，讓前端開發者和服務端開發者可以更好的完成協同開發。靜態網頁：頁面上的數據都是寫死的，萬年不變動態 ...
OpenGL ES 2.0 和 3.0區別

目錄一.嵌入式設備的 OpenGL ES 版本二.相容性三.著色器腳本 1.OpenGL ES shader 2.0 2.OpenGL ES shader 3.0 3.版本聲明 4. 預設精度修飾符 precision 4.輸入輸出 5.變數賦值四.關於頂點緩衝區對象 VBO 與頂點數組對象 ...
MyBatis（十三）：使用註解開發

一、什麼是使用註解開發使用註解開發就是無需再配置Mapper.xml文件，直接在介面中利用註解實現SQL語句。二、為什麼要使用註解開發正如官方文檔所說：使用註解來映射簡單語句會使代碼顯得更加簡潔。但對於稍微複雜一點的語句，Java 註解不僅力不從心，還會讓你本就複雜的 SQL 語句更加混亂 ...
day06-IO流應用01

Java坦克大戰06 8.IO流應用01 坦克大戰6.0版增加功能：防止敵人坦克重疊運動記錄玩家的成績（累計擊毀坦克數），存檔退出記錄當時的敵人坦克坐標，存檔退出玩游戲時，可以選擇是開新游戲還是繼續上局游戲 8.1防止敵人坦克重疊運動 8.1.1思路分析按照目標坦克的向右下左四種情況分析 ...
python基礎（待補充）

第一篇：電腦的基礎知識編程語言的介紹電腦介紹和五大組成平臺與軟體跨平臺介紹 CS、BS架構和網路通信協議操作系統的介紹 cpu詳解存儲器詳解操作系統啟動流程和BIOS介紹第二篇：python環境的搭建 python介紹和解釋器的安裝（暫略） python程式的運行方式和步驟集成開 ...
通俗易懂的瞭解String中的intern方法

首先，先看一下intern方法（JDK1.8）的官方文檔：全是英文，閱讀起來有點困難怎麼辦？沒關係，博主對此做了翻譯：返回字元串對象的規範表示形式。最初為空的字元串池由類字元串私人維護。調用intern方法時，如果池中已包含一個字元串，該字元串等於由equals（object）方法確定的該字 ...