Python抓取會員電影,會員自由不是夢

来源:https://www.cnblogs.com/123456feng/archive/2022/04/21/16173934.html
-Advertisement-
Play Games

開頭 看電影還在花錢?啥年代了?居然還有看電影花錢的,今天就給你上一課,讓你看看看電影是不需要花錢的。說乾就乾,衝衝 沖,代碼與實現思路就放在下麵了。 實現目的與思路 目的: 實現對騰訊視頻目標url的解析與下載,由於第三方vip解析,只提供線上觀看,隱藏想實現對目標視頻的下載 思路: 首先拿到想要 ...


開頭

看電影還在花錢?啥年代了?居然還有看電影花錢的,今天就給你上一課,讓你看看看電影是不需要花錢的。說乾就乾,衝衝

沖,代碼與實現思路就放在下麵了。

在這裡插入圖片描述

實現目的與思路

目的:

實現對騰訊視頻目標url的解析與下載,由於第三方vip解析,只提供線上觀看,隱藏想實現對目標視頻的下載

思路:

首先拿到想要看的騰訊電影url,通過第三方vip視頻解析網站進行解析,通過抓包,模擬瀏覽器發送正常請求,通過拿到緩存ts文

件,下載視頻ts文件,最後通過轉換為mp4文件,即可實現正常播放

在這裡插入圖片描述

完整代碼

Python
###Python學習交流Q群:906715085###
import re
import os,shutil
import requests,threading
from urllib.request import urlretrieve
from pyquery import PyQuery as pq
from multiprocessing import Pool
'''
'''
class video_down():    
def __init__(self,url):             
self.api='https://jx.618g.com'        
self.get_url = 'https://jx.618g.com/?url=' + url               
self.head = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}          
self.thread_num=32              
self.i = 0          
html = self.get_page(self.get_url)        
if html:                    
self.parse_page(html)    
def get_page(self,get_url):        
try:           
 print('正在請求目標網頁....',get_url)            
 response=requests.get(get_url,headers=self.head)            
 if response.status_code==200:                
 #print(response.text)                
 print('請求目標網頁完成....\n 準備解析....')                
 self.head['referer'] = get_url                
 return response.text        
 except Exception:            
 print('請求目標網頁失敗,請檢查錯誤重試')            
 return None

def parse_page(self,html):        
print('目標信息正在解析........')        
doc=pq(html)        
self.title=doc('head title').text()        
print(self.title)        
url = doc('#player').attr('src')[14:]        
html=self.get_m3u8_1(url).strip()        
#self.url = url + '800k/hls/index.m3u8'        
self.url = url[:-10] +html        
print(self.url)        
print('解析完成,獲取緩存ts文件.........')        
self.get_m3u8_2(self.url)    
def get_m3u8_1(self,url):        
try:            
response=requests.get(url,headers=self.head)            
html=response.text            
print('獲取ts文件成功,準備提取信息')            
return html[-20:]        
except Exception:            
print('緩存文件請求錯誤1,請檢查錯誤')

def get_m3u8_2(self,url):        
try:            
response=requests.get(url,headers=self.head)            
html=response.text            
print('獲取ts文件成功,準備提取信息')            
self.parse_ts_2(html)        
except Exception:            
print('緩存文件請求錯誤2,請檢查錯誤')    
def parse_ts_2(self,html):        
pattern=re.compile('.*?(.*?).ts')        
self.ts_lists=re.findall(pattern,html)        
print('信息提取完成......\n準備下載...')        
self.pool()    def pool(self):        
print('經計算需要下載%d個文件' % len(self.ts_lists))        
self.ts_url = self.url[:-10]        
if self.title not in os.listdir():            
os.makedirs(self.title)        
print('正在下載...所需時間較長,請耐心等待..')        #開啟多進程下載        p
ool=Pool(16)        
pool.map(self.save_ts,[ts_list for ts_list in self.ts_lists])        
pool.close()        
pool.join()        
print('下載完成')        
self.ts_to_mp4()    
def ts_to_mp4(self):        p
rint('ts文件正在進行轉錄mp4......')        
str='copy /b '+self.title+'\*.ts '+self.title+'.mp4'        
os.system(str)        
filename=self.title+'.mp4'        
if os.path.isfile(filename):            
print('轉換完成,祝你觀影愉快')            
shutil.rmtree(self.title)

def save_ts(self,ts_list):        
try:            
ts_urls = self.ts_url + '{}.ts'.format(ts_list)            
self.i += 1            
print('當前進度%d/%d'%(self.i,len(self.ts_lists)))            
urlretrieve(url=ts_urls, filename=self.title + '/{}.ts'.format(ts_list))        
except Exception:            
print('保存文件出現錯誤')



if __name__ == '__main__':    #電影目標url:狄仁傑之四大天王    
url='https://v.qq.com/x/cover/r6ri9qkcu66dna8.html'    #電影碟中諜5:神秘國度    url1='https://v.qq.com/x/cover/5c58griiqftvq00.html'    #電視劇鬥破蒼穹    url2='https://v.qq.com/x/cover/lcpwn26degwm7t3/z0027injhcq.html'    
url3='https://v.qq.com/x/cover/33bfp8mmgakf0gi.html'    video_down(url2)

 

視頻緩存ts文件

這裡都是一些緩存視頻文件,每個只有幾秒鐘播放,最後需要合併成一個mp4格式的視頻,就可以正常播放,預設高清下載 。

註意這裡的進度因為使用多進程下載,進度僅供參考,沒有確切顯示進度,可以進文件夾查看正常進度,可以理解為顯示一次進

度,下載一個ts文件

實現效果

在這裡插入圖片描述
在這裡插入圖片描述

結尾

每日分享的小技能都學會了嗎?今天給大家分享的這個小技能還是特別有用的,畢竟看電影不花錢誰不心動,心動就要行動,馬

上就動手爬起來。喜歡的小伙伴記得點贊收藏,畢竟點贊的都是人美心善的。不懂的小伙伴記得評論留言,看到就給你回覆。當

然,你也可以私信我啦!!!

在這裡插入圖片描述


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本文整理自拉勾網Vue.js 3.x 源碼課程,講師是來自Zoom的大牛黃軼,非常感謝! 本人僅補充一些參考資料。 1. Vue.js框架的演進過程 Vue.js 從 1.x 到 2.0 版本,最大的升級就是引入了虛擬 DOM 的概念。 Vue.js 2.x 的版本痛點問題: 源碼自身的維護性; 數 ...
  • 大家好,我是半夏👴,一個剛剛開始寫文的沙雕程式員.如果喜歡我的文章,可以關註➕ 點贊 👍 加我微信:frontendpicker,一起學習交流前端,成為更優秀的工程師~關註公眾號:搞前端的半夏,瞭解更多前端知識! 點我探索新世界! 原文鏈接 ==>http://sylblog.xin/archi ...
  • <!DOCTYPE html> <html> <head> <meta charset="UTF-8" /> <title>初識Vue</title> <!-- 引入Vue --> <script type="text/javascript" src="./js/vue.js"></script> ...
  • 《大話雲原生》系列文章期望用最通俗、簡單的語言說明雲原生生態系統內的組成及應用關係。此專欄的前兩篇文章 《【大話雲原生】煮餃子與docker、kubernetes之間的關係》 《【大話雲原生】負載均衡篇-小飯館的流量變大了》 歡迎品鑒! 一、服務接待中心與微服務網關 老婆最近快過生日了,我答應她去旅 ...
  • 文本文件可存儲的數據量多、每當需要分析或修改存儲在文件中的信息時,讀取文件都很有用,對數據分析應用程式 處理文件,讓程式能夠快速地分析大量的數據處理文件和保存數據可讓你的程式使用起來更容易 一、從文件中讀取數據1)讀取整個文件:先創建一個任意的文本文件,設置任意行,任意個數據,命名為data.txt ...
  • ##urllib的4個模板 1.request:最基本的http請求模塊,用來模擬發送請求,就像是在瀏覽器中輸入一個網址然後回車一樣,只需要傳入uel,timeout等參數就可以實現一個模擬請求。 主要功能:用於模擬發送請求打開和讀取URL。 2.error:異常處理模塊,如果出現請求錯誤,我們可以 ...
  • package com.oop;import java.io.IOException;//Demo1 類public class Demo1 { //main public static void main(String[] args) { } /* 修飾符 返回值類型 方法名(.....) { 方 ...
  • Write less to achieve more. 追求極簡是優秀程式員的特質之一,簡潔的代碼,不僅看起來更專業,可讀性更強,而且減少了出錯的幾率。 本文盤點一些Python中常用的一行(不限於一行)代碼,可直接用在日常編碼實踐中。 歡迎補充交流! 1. If-Else 三元操作符(ternar ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...