聊天尬住了?教你用Python一鍵獲取鬥圖表情包,從此搖身變海王

来源:https://www.cnblogs.com/hahaa/archive/2023/01/06/17025017.html
-Advertisement-
Play Games

很多兄弟在聊天上沒有下太多的功夫,導致自己聊天的時候很容易尬住,然後就不知道聊啥了,這時候合適表情包分分鐘就能救場,但是一看自己收藏的表情包,好家伙,兩隻手都數得過來。 所以今天來給兄弟們分享一下爬取表情包的代碼,再也不用尬聊了! 給大家看看我朋友的尬聊場面 本次目標 網站:發表情 網不好 ,沒載入 ...


很多兄弟在聊天上沒有下太多的功夫,導致自己聊天的時候很容易尬住,然後就不知道聊啥了,這時候合適表情包分分鐘就能救場,但是一看自己收藏的表情包,好家伙,兩隻手都數得過來。

所以今天來給兄弟們分享一下爬取表情包的代碼,再也不用尬聊了!

給大家看看我朋友的尬聊場面

 

 

本次目標

網站:發表情

網不好 ,沒載入出來,表弟又在當老六,看不該看的搶我網速!!!

使用的工具

環境:Python3.8、pycharm
需要安裝的第三方模塊:lxml 、requests

頁面分析

  1. 靜態還是動態 get
  2. 翻頁規律
  3. 在img標簽下 獲取屬性
    src屬性 data 下載鏈接
    獲取title屬性值 圖片的名字xpath

代碼實戰

# 導入模塊
import requests  # 請求模塊 
from lxml import etree  # 解析模塊 
import urllib.request  # 內置模塊 
import re  # 正則
# 文章不理解,我也錄製了相應的視頻講解
# 直接在這個君羊:708525271領取就好了,包括完整代碼 
num = 0
for i in range(1,11):
    url = f'https://**網址屏蔽了,不然過不了/biaoqing/lists/page/{i}.html'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
    }  # 模擬用戶 爬取數據
    response = requests.get(url,headers=headers)
    data = response.text
    # print(data)   # 輸出
    # 創建對象 html-->xml
    html = etree.HTML(data)
    # 找到所有img標簽 //在任意節點去匹配 不需要考慮位置 //img[@class="ui image lazy"]
    img_tag = html.xpath('//img[@class="ui image lazy"]')
    # print(len(img_tag))  # 一個頁面有45個表情包
    for img in img_tag:
        # print()
        # 下載鏈接
        src = img.xpath('@data-original')[0]
        # print(src)
        # 名字 當前的img下麵找當前節點 title屬性'@title'
        name = img.xpath('@title')[0]
        # print(name)
        title = re.sub('[\ / : * ? " < > |]',"", name)  # 替換
        urllib.request.urlretrieve(src,f'img/{title}{num}.jpg')  # 保存
        print(f'{num}張爬取完畢')
        num+=1   # 等價於num=num+1

 

採集結果


最後

表情包在手,你就是鬥圖之王,沒什麼事情是一個表情包不能解決的,如果有,那就多發一些!

趕緊去試試吧,記得給小編一個三連吧!麽麽噠!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • JZ85 連續子數組的最大和(二) 題目 輸入一個長度為n的整型數組array,數組中的一個或連續多個整數組成一個子數組,找到一個具有最大和的連續子數組。 1.子數組是連續的,比如[1,3,5,7,9]的子數組有[1,3],[3,5,7]等等,但是[1,3,7]不是子數組 2.如果存在多個最大和的連 ...
  • 快過年了,手頭有點緊,但是作為一個男人,身上怎麼能夠沒有大把鈔票呢? 於是我決定用Python來分析一波股票,贏了會所嫩*,輸了下海幹活! 好了,上面是我吹牛逼的,不過確實有小伙伴看了爬股票數據進行分析的教程中過,但是我還是不建議各位去碰這玩意,今天咱們就是純純的分享技術哈~ 準備工作 既然要去賺馬 ...
  • 2023-01-06 一、處理請求響應亂碼問題 通過過濾器處理亂碼問題 請求亂碼和響應亂碼 (1)創建一個"web Application"項目,命名為“bookstore06”,將"bookstore05"的代碼遷移過去。(點擊bookstore05項目中的“Show in Explorer”,將 ...
  • 結論:final 修飾對象,對象的內容可變,引用不可變。 final 應用於類、方法和變數、對象時意義是不同的,但本質是一樣的,都表示不可改變。 但是修飾對象時要註意:因為對象是引用類型,存儲的是地址,所以final修飾之後,指的是引用地址不可變。 案例: final char[] chars = ...
  • 簡介 java.lang.reflect.Proxy是整個jdk中實現動態代理的核心 類,本文主要介紹Proxy類的實現,關於Proxy類的使用請自行查閱其他資料。 Field constructorParams:構造函數的參數,用於代理類的核心的邏輯實現,關於InvocationHandler這個 ...
  • 指針是學習C\C++的一個重難點,同時也是這個語言的關鍵知識點。如果不能夠對指針有著深刻的理解,會對學習C\C++有著極大的阻礙。 普通變數和指針變數的區別 普通變數和指針變數都同為變數。對於一個變數來說,都具有值和地址兩個屬性。假設一個普通變數a = 5,其值為5,&a為變數a在記憶體占有的地址。此 ...
  • 1. 什麼是迭代器? 迭代器是一個表示數據流的對象,當我們調用next()方法時會返回容器中的下一個值 迭代器中包含__iter__和__next__()方法。通過__iter__方法可以返回迭代器對象本身的方法。__next__()方法會使cur指針始終指向當前位置,即返回容器中的下一個值,如果容 ...
  • 2023-01-06 一、過濾器鏈 1、含義:如果出現一個請求存在多個過濾器對其過濾,出現過濾器鏈。 在放行前,過濾器是正序執行,放行後過濾器是倒序執行。 2、過濾器的順序:是與filter-mapping配置上下文位置有關 二、監聽器 1、作用範圍: (1)監聽域對象的創建和銷毀 域對象: ①Se ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...