python爬視頻實例_ZenDei技術網路在線

python爬視頻實例

-Advertisement-

例：抓取PhotoShop視頻教程網址http://www.mxiaobei.com/?id=424 BeautifulSoup: https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/ Requests: http://cn.python reque ...

例：抓取PhotoShop視頻教程網址http://www.mxiaobei.com/?id=424

import requests
import re
from bs4 import BeautifulSoup
import time

dicts = {}
list1 = set()

print('start')

ua = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'

urls = 'http://www.mxiaobei.com/?id='

for index in range(451, 565):
    r = requests.get(urls + str(index), headers = {'user-agent': ua })
    r.encoding = 'utf-8'
    soup = BeautifulSoup(r.text, 'lxml')
    title = soup.find(name='h2')
    mp4url = soup.find('div', id='CuPlayer')
    if mp4url is None:
        list1.add(index)
        continue
    mpurl = re.search('http.*?mp4', mp4url.text)
    dicts[title.text] = mpurl.group()
    #print(index)
    #time.sleep(1)
    #print(title.text + ' : ' + dicts[title.text])
print(dicts)
print(list1)
for temp in dicts.items():
    #time.sleep(1)
    r = requests.get(temp[1], stream=True)
    with open(temp[0] + '.mp4', "wb") as mp4:
        for chunk in r.iter_content(chunk_size=1024 * 1024):
            if chunk:
                mp4.write(chunk)
    print(temp[0]+'下載完成')
print('end!')

BeautifulSoup: https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/
Requests: http://cn.python-requests.org/zh_CN/latest/

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Java8 Optional

Java8 新增了 Optional 類，可以更加優雅地解決空指針的問題。構造器 Optional 的構造器是私有的，不能通過 new 的方式來創建 Optional 對象，因此，Optional 提供了三個靜態方法創建 Optional 對象，分別為 /`of(T value) ofNullab ...
SpringIOC源碼解析（上）

註意，看完這篇文章需要很長很長很長時間。。。準備工作本文會分析Spring的IOC模塊的整體流程，分析過程需要使用一個簡單的demo工程來啟動Spring，demo工程我以備好，需要的童鞋自行在下方鏈接下載： 1 https://github.com/shiyujun/spring-framew ...
【Vue的路由，SPA概念】

前言本章是為了以後實現前端頁面的搭建而寫的，重點在於如何實現單頁Web應用因為相對於以前的傳統多頁面web，有很大的缺陷。那麼就必須瞭解一下Vue的路由設置。 SPA的概念總的而言，我們知道之前的話都是用的是許多jsp,或html頁面來組成我們的項目的。那麼這樣有什麼缺點呢？所以，在 ...
C++中const關鍵字用法總結

先發個標題，明天再碼 ...
F#周報2019年第31期

新聞 "現在開始接受FSSF的第七次師友計劃申請" "Xamarin播客：XAML熱重載" "TorchSharp：將PyTorch引擎帶入.NET" 視頻及幻燈片 "F 中的非同步編程2/3——實現非同步工作流" "ML.NET中的異常檢測轉換" 博客 "使用F 腳本進行互動式開發" "在AWS La ...
圖解數據結構樹之AVL樹

AVL樹(平衡二叉樹)： AVL樹本質上是一顆二叉查找樹，但是它又具有以下特點：它是一棵空樹或它的左右兩個子樹的高度差的絕對值不超過1，並且左右兩個子樹都是一棵平衡二叉樹。在AVL樹中任何節點的兩個子樹的高度最大差別為一，所以它也被稱為平衡二叉樹。下麵是平衡二叉樹和非平衡二叉樹對比的例圖：平衡因數 ...
學習python基礎規則

前面應該是記流水賬的方式，畢竟學習的內容不多無法產出什麼有效的內容。這兩天從開始下載Python開始學習，一路順暢冒的問題，直到開始學習python的游戲規則，嚴格縮進、註釋及‘’的使用等感覺還不錯，多看幾遍都可以記下來，但是沒實操過還是有點記憶較差。 python對象，也就是列表等使用規則和特征 ...
Qt實現表格樹控制項-支持多級表頭

[TOC] 原文鏈接： "Qt實現表格樹控制項支持多級表頭" 一、概述之前寫過一篇關於表格控制項多級表頭的文章，喜歡的話可以參考 "Qt實現表格控制項支持多級列表頭、多級行表頭、單元格合併、字體設置等" 。今天這篇文章帶來了比表格更加複雜的控制項樹控制項多級表頭實現。在Qt中，表格控制項包含有水平和垂 ...