Python抓取會員電影，會員自由不是夢

-Advertisement-

開頭看電影還在花錢？啥年代了？居然還有看電影花錢的，今天就給你上一課，讓你看看看電影是不需要花錢的。說乾就乾，衝衝沖，代碼與實現思路就放在下麵了。實現目的與思路目的：實現對騰訊視頻目標url的解析與下載，由於第三方vip解析，只提供線上觀看，隱藏想實現對目標視頻的下載思路：首先拿到想要 ...

開頭

看電影還在花錢？啥年代了？居然還有看電影花錢的，今天就給你上一課，讓你看看看電影是不需要花錢的。說乾就乾，衝衝

沖，代碼與實現思路就放在下麵了。

在這裡插入圖片描述

實現目的與思路

目的：

實現對騰訊視頻目標url的解析與下載，由於第三方vip解析，只提供線上觀看，隱藏想實現對目標視頻的下載

思路：

首先拿到想要看的騰訊電影url,通過第三方vip視頻解析網站進行解析，通過抓包，模擬瀏覽器發送正常請求，通過拿到緩存ts文

件，下載視頻ts文件，最後通過轉換為mp4文件，即可實現正常播放

在這裡插入圖片描述

完整代碼

Python
###Python學習交流Q群：906715085###
import re
import os,shutil
import requests,threading
from urllib.request import urlretrieve
from pyquery import PyQuery as pq
from multiprocessing import Pool
'''
'''
class video_down():    
def __init__(self,url):             
self.api='https://jx.618g.com'        
self.get_url = 'https://jx.618g.com/?url=' + url               
self.head = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}          
self.thread_num=32              
self.i = 0          
html = self.get_page(self.get_url)        
if html:                    
self.parse_page(html)    
def get_page(self,get_url):        
try:           
 print('正在請求目標網頁....',get_url)            
 response=requests.get(get_url,headers=self.head)            
 if response.status_code==200:                
 #print(response.text)                
 print('請求目標網頁完成....\n 準備解析....')                
 self.head['referer'] = get_url                
 return response.text        
 except Exception:            
 print('請求目標網頁失敗，請檢查錯誤重試')            
 return None

def parse_page(self,html):        
print('目標信息正在解析........')        
doc=pq(html)        
self.title=doc('head title').text()        
print(self.title)        
url = doc('#player').attr('src')[14:]        
html=self.get_m3u8_1(url).strip()        
#self.url = url + '800k/hls/index.m3u8'        
self.url = url[:-10] +html        
print(self.url)        
print('解析完成，獲取緩存ts文件.........')        
self.get_m3u8_2(self.url)    
def get_m3u8_1(self,url):        
try:            
response=requests.get(url,headers=self.head)            
html=response.text            
print('獲取ts文件成功，準備提取信息')            
return html[-20:]        
except Exception:            
print('緩存文件請求錯誤1，請檢查錯誤')

def get_m3u8_2(self,url):        
try:            
response=requests.get(url,headers=self.head)            
html=response.text            
print('獲取ts文件成功，準備提取信息')            
self.parse_ts_2(html)        
except Exception:            
print('緩存文件請求錯誤2，請檢查錯誤')    
def parse_ts_2(self,html):        
pattern=re.compile('.*?(.*?).ts')        
self.ts_lists=re.findall(pattern,html)        
print('信息提取完成......\n準備下載...')        
self.pool()    def pool(self):        
print('經計算需要下載%d個文件' % len(self.ts_lists))        
self.ts_url = self.url[:-10]        
if self.title not in os.listdir():            
os.makedirs(self.title)        
print('正在下載...所需時間較長，請耐心等待..')        #開啟多進程下載        p
ool=Pool(16)        
pool.map(self.save_ts,[ts_list for ts_list in self.ts_lists])        
pool.close()        
pool.join()        
print('下載完成')        
self.ts_to_mp4()    
def ts_to_mp4(self):        p
rint('ts文件正在進行轉錄mp4......')        
str='copy /b '+self.title+'\*.ts '+self.title+'.mp4'        
os.system(str)        
filename=self.title+'.mp4'        
if os.path.isfile(filename):            
print('轉換完成，祝你觀影愉快')            
shutil.rmtree(self.title)

def save_ts(self,ts_list):        
try:            
ts_urls = self.ts_url + '{}.ts'.format(ts_list)            
self.i += 1            
print('當前進度%d/%d'%(self.i,len(self.ts_lists)))            
urlretrieve(url=ts_urls, filename=self.title + '/{}.ts'.format(ts_list))        
except Exception:            
print('保存文件出現錯誤')



if __name__ == '__main__':    #電影目標url：狄仁傑之四大天王    
url='https://v.qq.com/x/cover/r6ri9qkcu66dna8.html'    #電影碟中諜5：神秘國度    url1='https://v.qq.com/x/cover/5c58griiqftvq00.html'    #電視劇鬥破蒼穹    url2='https://v.qq.com/x/cover/lcpwn26degwm7t3/z0027injhcq.html'    
url3='https://v.qq.com/x/cover/33bfp8mmgakf0gi.html'    video_down(url2)

視頻緩存ts文件

這裡都是一些緩存視頻文件，每個只有幾秒鐘播放，最後需要合併成一個mp4格式的視頻，就可以正常播放，預設高清下載。

註意這裡的進度因為使用多進程下載，進度僅供參考，沒有確切顯示進度，可以進文件夾查看正常進度，可以理解為顯示一次進

度，下載一個ts文件

實現效果

在這裡插入圖片描述

結尾

每日分享的小技能都學會了嗎？今天給大家分享的這個小技能還是特別有用的，畢竟看電影不花錢誰不心動，心動就要行動，馬

上就動手爬起來。喜歡的小伙伴記得點贊收藏，畢竟點贊的都是人美心善的。不懂的小伙伴記得評論留言，看到就給你回覆。當

然，你也可以私信我啦！！！

在這裡插入圖片描述

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Vue.js 3.x 優化概覽

本文整理自拉勾網Vue.js 3.x 源碼課程，講師是來自Zoom的大牛黃軼，非常感謝！本人僅補充一些參考資料。 1. Vue.js框架的演進過程 Vue.js 從 1.x 到 2.0 版本，最大的升級就是引入了虛擬 DOM 的概念。 Vue.js 2.x 的版本痛點問題：源碼自身的維護性；數 ...
24張圖攻剋border-image

大家好，我是半夏👴，一個剛剛開始寫文的沙雕程式員.如果喜歡我的文章，可以關註➕ 點贊 👍 加我微信：frontendpicker，一起學習交流前端，成為更優秀的工程師～關註公眾號：搞前端的半夏,瞭解更多前端知識! 點我探索新世界！原文鏈接 ==>http://sylblog.xin/archi ...
1.初始Vue

<!DOCTYPE html> <html> <head> <meta charset="UTF-8" /> <title>初識Vue</title>  <script type="text/javascript" src="./js/vue.js"></script> ...
解決go-micro與其它gRPC框架之間的通信問題

《大話雲原生》系列文章期望用最通俗、簡單的語言說明雲原生生態系統內的組成及應用關係。此專欄的前兩篇文章《【大話雲原生】煮餃子與docker、kubernetes之間的關係》《【大話雲原生】負載均衡篇-小飯館的流量變大了》歡迎品鑒！一、服務接待中心與微服務網關老婆最近快過生日了，我答應她去旅 ...
python中如何讀取文件

文本文件可存儲的數據量多、每當需要分析或修改存儲在文件中的信息時，讀取文件都很有用，對數據分析應用程式處理文件，讓程式能夠快速地分析大量的數據處理文件和保存數據可讓你的程式使用起來更容易一、從文件中讀取數據1）讀取整個文件：先創建一個任意的文本文件，設置任意行，任意個數據，命名為data.txt ...
Urllib的4個模板

##urllib的4個模板 1.request:最基本的http請求模塊，用來模擬發送請求，就像是在瀏覽器中輸入一個網址然後回車一樣，只需要傳入uel，timeout等參數就可以實現一個模擬請求。主要功能:用於模擬發送請求打開和讀取URL。 2.error：異常處理模塊，如果出現請求錯誤，我們可以 ...
Day10

package com.oop;import java.io.IOException;//Demo1 類public class Demo1 { //main public static void main(String[] args) { } /* 修飾符返回值類型方法名（.....） { 方 ...
最全Python一行代碼片段，可直接使用

Write less to achieve more. 追求極簡是優秀程式員的特質之一，簡潔的代碼，不僅看起來更專業，可讀性更強，而且減少了出錯的幾率。本文盤點一些Python中常用的一行（不限於一行）代碼，可直接用在日常編碼實踐中。歡迎補充交流！ 1. If-Else 三元操作符(ternar ...