只要網速夠快,小視頻看完一個刪一個,任性!Python爬取小視頻

来源:https://www.cnblogs.com/python0921/archive/2020/05/08/12853341.html
-Advertisement-
Play Games

前言 yy平臺,直播界的先驅,有很多主播會把一些自己的直播精彩看點上傳到該平臺下的小視頻欄目中 今天帶大家爬取yy小視頻欄目中所有的小視頻 課程知識點: 1、動態數據抓包演示 2、json數據解析方法 3、視頻數據保存 環境介紹: python 3.6 pycharm requests 爬蟲的一般思 ...


 

 

前言

yy平臺,直播界的先驅,有很多主播會把一些自己的直播精彩看點上傳到該平臺下的小視頻欄目中

今天帶大家爬取yy小視頻欄目中所有的小視頻

課程知識點:

1、動態數據抓包演示

2、json數據解析方法

3、視頻數據保存

環境介紹:

python 3.6

pycharm

requests

爬蟲的一般思路:

1、分析目標網頁,確定爬取的url路徑,headers參數

 

2、發送請求 -- requests 模擬瀏覽器發送請求,獲取響應數據

3、解析數據

4、保存數據

導入工具

import requests
import re
import pprint

 

分析目標網頁,確定爬取的url路徑,headers參數

url地址:

 

參數

 

url = 'https://api-tinyvideo-web.yy.com/home/tinyvideos?'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36',
}

param = {
    'data': '{"uid":0,"page":1,"pageSize":10}',
}

 

 

發送請求 -- requests 模擬瀏覽器發送請求,獲取響應數據

 

 

response = requests.get(url=url, headers=headers, params=param)
data = response.json()
# print(data)

 

解析數據

 

# 提取欄位
data_list = data['data']['data']

# 迴圈遍歷
for data1 in data_list:
    resdesc = data1['resdesc'] + '.mp4'  # 視頻的題目
    resurl = data1['resurl']  # 視頻的url地址
    # print(resdesc, resurl)

    # new_title = change_title(resdesc)

    video_data = requests.get(resurl, headers=headers).content

 

保存數據

 

with open('video\\' + resdesc, mode='wb') as f:
        print('正在下載:', resdesc)
        f.write(video_data)

 

運行代碼,效果如下:

 

不管你是零基礎還是有基礎都可以獲取到自己相對應的學習禮包!包括Python軟體工具和2020最新入門到實戰教程。加群695185429即可免費獲取。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • `Apache Dubbo Java RPC` 框架,它提供了三大核心能力:面向介面的遠程方法調用,智能容錯和負載均衡,以及服務自動註冊和發現。 註意,是 ,不再是 。簡單來說就是 將 移交給 開源社區進行維護。參見 "dubbo spring boot project" "Spring Boot ...
  • 五一假期大雄看了一本《java併發編程藝術》,瞭解了線程池的基本工作流程,竟然發現線程池工作原理和互聯網公司運作模式十分相似。 線程池處理流程 原理解析 互聯網公司與線程池的關係 這裡用一個比喻來描述一下線程池,中間有一些名詞你可能不是太清楚,後邊源碼解析的部分會講到。 你可以把 線程池 看作是一個 ...
  • "python3_zipfile_創建壓縮文件" 轉載註明來源: "本文鏈接" 來自 "osnosn的博客" ,寫於 2020 05 08. ZipFile的 預設是 ZIP_STORED(僅存儲不壓縮)。 所以要指定為 (zip演算法),或 (lzma演算法,壓縮率高,就是慢了點) 要py3.7以上才 ...
  • 1 簡介 是`Spring spring core ReflectionTestUtils spring test ReflectionUtils ReflectionTestUtils`,能增加我們的便利性。 假設我們需要創建一個類,但它的某些成員變數是私有的,並且沒有提供公共的 方法,而我們無法 ...
  • 在前面的篇幅中,我們對認證和授權流程大致梳理了一遍。在這個過程中我們一直都是使用系統生成的預設頁面,登錄成功後也是直接調轉到根路徑頁面。而在實際的開發過程中,我們是需要自定義登錄頁面的,有時還會添加各類驗證機制,在登錄成功後會跳轉至指定頁面,還會進行各種美化,甚至是前後端分離的方式。這時,就需要我們... ...
  • `range` 類型表示不可變的數字序列,通常用於在 `for` 迴圈中迴圈指定的次數。 range 類型相比常規 list 或 tuple 的優勢在於一個 range 對象總是占用固定數量的(較小)記憶體,不論其所表示的範圍有多大(因為它只保存了 start, stop 和 step 值,並會根據需... ...
  • 前言:jsp拋出異常,雖不影響正常運行,但是感覺不舒服。 解決方案: 1、Jsp解決辦法,在程式的最後添加: out.clear(); out = pageContext.pushBody(); 2、Struts2解決辦法直接讓action中的處理方法返回null。 2、SpringMvc解決辦法讓 ...
  • 元組是由一系列按特定順序排序的元素組成的序列結構。 元組的所有元素都放在一對小括弧`( )`(小括弧不是必須的,只要將各元素用逗號隔開,Python 就會將其視為元組)中,相鄰元素之間用逗號`,`分隔(通常還會在逗號後加一個空格),可以存儲數字、字元串、列表、元組等任何類型的數據,並且在同一個元組中... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...