聊天尬住了？教你用Python一鍵獲取鬥圖表情包，從此搖身變海王

-Advertisement-

很多兄弟在聊天上沒有下太多的功夫，導致自己聊天的時候很容易尬住，然後就不知道聊啥了，這時候合適表情包分分鐘就能救場，但是一看自己收藏的表情包，好家伙，兩隻手都數得過來。所以今天來給兄弟們分享一下爬取表情包的代碼，再也不用尬聊了！給大家看看我朋友的尬聊場面本次目標網站：發表情網不好，沒載入 ...

很多兄弟在聊天上沒有下太多的功夫，導致自己聊天的時候很容易尬住，然後就不知道聊啥了，這時候合適表情包分分鐘就能救場，但是一看自己收藏的表情包，好家伙，兩隻手都數得過來。

所以今天來給兄弟們分享一下爬取表情包的代碼，再也不用尬聊了！

給大家看看我朋友的尬聊場面

本次目標

網站：發表情

網不好，沒載入出來，表弟又在當老六，看不該看的搶我網速！！！

使用的工具

環境：Python3.8、pycharm
需要安裝的第三方模塊：lxml 、requests

頁面分析

靜態還是動態 get
翻頁規律
在img標簽下獲取屬性
src屬性 data 下載鏈接
獲取title屬性值圖片的名字xpath

代碼實戰

# 導入模塊
import requests  # 請求模塊 
from lxml import etree  # 解析模塊 
import urllib.request  # 內置模塊 
import re  # 正則
# 文章不理解，我也錄製了相應的視頻講解
# 直接在這個君羊：708525271領取就好了，包括完整代碼 
num = 0
for i in range(1,11):
    url = f'https://**網址屏蔽了，不然過不了/biaoqing/lists/page/{i}.html'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
    }  # 模擬用戶 爬取數據
    response = requests.get(url,headers=headers)
    data = response.text
    # print(data)   # 輸出
    # 創建對象 html-->xml
    html = etree.HTML(data)
    # 找到所有img標簽 //在任意節點去匹配 不需要考慮位置 //img[@class="ui image lazy"]
    img_tag = html.xpath('//img[@class="ui image lazy"]')
    # print(len(img_tag))  # 一個頁面有45個表情包
    for img in img_tag:
        # print()
        # 下載鏈接
        src = img.xpath('@data-original')[0]
        # print(src)
        # 名字 當前的img下麵找當前節點 title屬性'@title'
        name = img.xpath('@title')[0]
        # print(name)
        title = re.sub('[\ / : * ? " < > |]',"", name)  # 替換
        urllib.request.urlretrieve(src,f'img/{title}{num}.jpg')  # 保存
        print(f'{num}張爬取完畢')
        num+=1   # 等價於num=num+1

採集結果

最後

表情包在手，你就是鬥圖之王，沒什麼事情是一個表情包不能解決的，如果有，那就多發一些！

趕緊去試試吧，記得給小編一個三連吧！麽麽噠！

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

每日演算法之連續子數組的最大和(二)

JZ85 連續子數組的最大和(二) 題目輸入一個長度為n的整型數組array，數組中的一個或連續多個整數組成一個子數組，找到一個具有最大和的連續子數組。 1.子數組是連續的，比如[1,3,5,7,9]的子數組有[1,3]，[3,5,7]等等，但是[1,3,7]不是子數組 2.如果存在多個最大和的連 ...
Python爬取往期股票數據，分析中獎規律！

快過年了，手頭有點緊，但是作為一個男人，身上怎麼能夠沒有大把鈔票呢？於是我決定用Python來分析一波股票，贏了會所嫩*，輸了下海幹活！好了，上面是我吹牛逼的，不過確實有小伙伴看了爬股票數據進行分析的教程中過，但是我還是不建議各位去碰這玩意，今天咱們就是純純的分享技術哈~ 準備工作既然要去賺馬 ...
學習筆記——書城項目第六階段之處理請求響應亂碼問題

2023-01-06 一、處理請求響應亂碼問題通過過濾器處理亂碼問題請求亂碼和響應亂碼（1）創建一個"web Application"項目，命名為“bookstore06”,將"bookstore05"的代碼遷移過去。（點擊bookstore05項目中的“Show in Explorer”,將 ...
Java final關鍵字修飾對象

結論：final 修飾對象，對象的內容可變，引用不可變。 final 應用於類、方法和變數、對象時意義是不同的，但本質是一樣的，都表示不可改變。但是修飾對象時要註意：因為對象是引用類型，存儲的是地址，所以final修飾之後，指的是引用地址不可變。案例： final char[] chars = ...
動態代理原理

簡介 java.lang.reflect.Proxy是整個jdk中實現動態代理的核心類，本文主要介紹Proxy類的實現，關於Proxy類的使用請自行查閱其他資料。 Field constructorParams：構造函數的參數，用於代理類的核心的邏輯實現，關於InvocationHandler這個 ...
C/C++基礎知識——對指針的理解

指針是學習C\C++的一個重難點，同時也是這個語言的關鍵知識點。如果不能夠對指針有著深刻的理解，會對學習C\C++有著極大的阻礙。普通變數和指針變數的區別普通變數和指針變數都同為變數。對於一個變數來說，都具有值和地址兩個屬性。假設一個普通變數a = 5,其值為5，&a為變數a在記憶體占有的地址。此 ...
Python 迭代器Iterator詳情

1. 什麼是迭代器？迭代器是一個表示數據流的對象，當我們調用next()方法時會返回容器中的下一個值迭代器中包含__iter__和__next__()方法。通過__iter__方法可以返回迭代器對象本身的方法。__next__()方法會使cur指針始終指向當前位置，即返回容器中的下一個值，如果容 ...
學習筆記——過濾器鏈；監聽器；Servlet、Filter、Listener的註解方式開發

2023-01-06 一、過濾器鏈 1、含義：如果出現一個請求存在多個過濾器對其過濾，出現過濾器鏈。在放行前，過濾器是正序執行，放行後過濾器是倒序執行。 2、過濾器的順序：是與filter-mapping配置上下文位置有關二、監聽器 1、作用範圍：（1）監聽域對象的創建和銷毀域對象： ①Se ...