發現一個舔狗神器,Python真的太厲害了,自動下載妹子視頻...

来源:https://www.cnblogs.com/hahaa/archive/2022/08/18/16596501.html
-Advertisement-
Play Games

兄弟們,現在短視頻主播好看的妹子太多了,有時候遇到自己喜歡的,雖然點了贊或者收藏了,但是萬一主播把視頻隱藏下架了呢? 所以今天咱們就用Python來把這些好看的視頻統統保存下來… 涉及知識點 1、動態數據抓包演示 2、json數據解析方法 3、視頻數據保存 環境介紹 python 3.6 pycha ...


兄弟們,現在短視頻主播好看的妹子太多了,有時候遇到自己喜歡的,雖然點了贊或者收藏了,但是萬一主播把視頻隱藏下架了呢?

所以今天咱們就用Python來把這些好看的視頻統統保存下來…


 

 

涉及知識點

1、動態數據抓包演示
2、json數據解析方法
3、視頻數據保存

環境介紹

python 3.6
pycharm
requests

 

案例實現步驟

  1. 找數據對應的地址(url)請求
  2. 發送請求
  3. 數據的解析
  4. 數據保存

案例流程

使用的模塊

import requests  # 第三方模塊
import pprint  # 格式化輸出模塊
import re   # 正則

 

只有requests是第三方模塊,需要手動安裝一下,pip install requests .

替換非法字元

def change_title(title):
    """替換非法字元"""
    pattern = re.compile(r'[\\\/\:\*\?\"\<\>\|]')
    new_title = re.sub(pattern, '_', title)
    return new_title

 

找數據對應的地址(url)請求

url = 'https://api-tinyvideo-web.yy.com/home/tinyvideosv2'
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}

params = {
    'data': '{"uid":0,"page":1,"pageSize":10}'

 

發送請求

response = requests.get(url=url, headers=headers, params=params)
json_data = response.json()

 

數據的解析

data_list = json_data['data']['data']

for data in data_list:
    video_title = data['username'] + '.mp4'  
    video_url = data['resurl']  

    video_data = requests.get(url=video_url, headers=headers).content

    new_title = change_title(video_title)

 

數據保存

with open('video\\' + new_title, mode='wb') as f:
    f.write(video_data)
    print('保存完成:', video_title)
# 完整源碼及多頁爬取源碼都在這個群啦 279199867

 

效果展示

單頁下載

 

 

 

 



多頁下載

 

 

 

 



好了兄弟們,今天的分享就到這裡嘍!

給大家推薦一套Python教程,包含了常見的百來個案例,希望對大家有所幫助!

代碼總是學完就忘記?100個爬蟲實戰項目!讓你沉迷學習丨學以致用丨下一個Python大神就是你!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 當我們拿到一個對象的引用時,如何知道這個對象是什麼類型、有哪些方法呢? 1.使用type() 首先,我們來判斷對象類型,使用type()函數: 基本類型都可以用type()判斷: >>> type(123) <class 'int'> >>> type('str') <class 'str'> >> ...
  • 1、先配置spring、springmvc通用xml文件的頭部信息 spring、springmvc通用xml文件的模板內容如下: 1 <?xml version="1.0" encoding="UTF-8"?> 2 <beans xmlns="http://www.springframework. ...
  • 使用文件流對文件進行複製: package io; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExce ...
  • K 哥之前寫過一篇關於百度翻譯逆向的文章,也在 bilibili 上出過相應的視頻,最近在 K 哥爬蟲交流群中有群友提出,百度翻譯新增了一個請求頭參數 Acs-Token,如果不攜帶該參數,直接按照以前的方法進行處理,會出現 1022 報錯,並且如果直接將 Acs-Token 寫成定值,前幾次可能能 ...
  • 1、標記跳過 在自動化測試過程中,我們經常會遇到因為某些功能阻塞,未開發完成或者環境等問題,一些測試用例不能執行,如果人工去註釋掉,後面還需要再恢復才能繼續測試,pytest的標記跳過功能就可以實現暫時跳過。 (一)無條件跳過skip 使用方法:通過@pytest.mark.skip(reason= ...
  • 0. 原代碼預覽 簡單實現在資料庫中插入數據 public void testInsert() throws IOException { //獲取核心配置文件的輸入流 InputStream is = Resources.getResourceAsStream("mybatis-config.xml ...
  • 最近在使用海康威視的攝像頭進行車牌抓拍,使用了海康威視設備網路SDK,便稍做包裝,便於項目調用。 項目地址 https://github.com/Mr-LuXiaoHua/hikivision-sdk 海康設備網路SDK版本 CH-HCNetSDKV6.1.9.4_build20220412_win ...
  • 1. Page Cache 1.1 Page Cache 是什麼? 為了理解 Page Cache,我們不妨先看一下 Linux 的文件 I/O 系統,如下圖所示: Figure1. Linux 文件 I/O 系統 上圖中,紅色部分為 Page Cache。可見 Page Cache 的本質是由 L ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...