Python 實現 m3u8 視頻下載

来源:https://www.cnblogs.com/yuzhihui/archive/2023/05/30/17443299.html
-Advertisement-
Play Games

# Python 實現 m3u8 視頻下載 m3u8 是一種**基於文本的媒體播放列表文件格式**,通常用於指定流媒體播放器播放線上媒體流。它是一個簡單的文本文件,其中包含多個由 URI 引用的媒體資源文件的 URL。m3u8 文件通常包含多個 ts 文件的鏈接,這些 ts 文件是實際的視頻和音頻數 ...


Python 實現 m3u8 視頻下載

m3u8 是一種基於文本的媒體播放列表文件格式,通常用於指定流媒體播放器播放線上媒體流。它是一個簡單的文本文件,其中包含多個由 URI 引用的媒體資源文件的 URL。m3u8 文件通常包含多個 ts 文件的鏈接,這些 ts 文件是實際的視頻和音頻數據文件,通常是通過 HTTP 協議傳輸。

ts 文件是一種流媒體傳輸格式,是 MPEG-2 傳輸流(MPEG-2 Transport Stream)的縮寫。ts 文件通常用於存儲視頻、音頻和字幕等媒體數據,是流媒體傳輸的基本單位。在 m3u8 文件中,ts 文件通常是通過 URI 引用的方式來指定的,播放器會根據 m3u8 文件中的 ts 文件鏈接,依次請求並下載 ts 文件,然後將其組合成完整的視頻流進行播放。

因此,m3u8 文件和 ts 文件在流媒體播放領域密切相關,m3u8 文件是流媒體的播放列表,而 ts 文件是實際的媒體數據文件。m3u8 文件中包含了多個 ts 文件的鏈接,播放器會根據 m3u8 文件中的 ts 文件鏈接,依次請求並下載 ts 文件,然後將其組合成完整的視頻流進行播放。這種方式可以充分利用網路帶寬,提高流媒體的播放效率和質量。同時,m3u8 文件還可以通過定義不同的碼率和解析度等參數,實現適應不同網路環境和設備的自適應流媒體播放。

img

基礎實現

以下是使用 Python 下載 m3u8 視頻並保存為 mp4 的示例代碼:

import requests
import os

def download_m3u8_video(url, file_path):
    r = requests.get(url)
    if r.status_code != 200:
        print('m3u8視頻下載鏈接無效')
        return False

    m3u8_list = r.text.split('\n')
    m3u8_list = [i for i in m3u8_list if i and i[0] != '#']

    ts_list = []
    for ts_url in m3u8_list:
        ts_url = url.rsplit('/', 1)[0] + '/' + ts_url
        ts_list.append(ts_url)

    with open(file_path, 'wb') as f:
        for ts_url in ts_list:
            r = requests.get(ts_url)
            if r.status_code == 200:
                f.write(r.content)
    print('m3u8視頻下載完成')
    return True

def convert_ts_to_mp4(ts_file_path, mp4_file_path):
    os.system(f'ffmpeg -i {ts_file_path} -c copy {mp4_file_path}')

if __name__ == '__main__':
    url = '輸入m3u8流媒體播放列表文件下載鏈接'
    ts_file_path = '輸入ts文件保存路徑'
    mp4_file_path = '輸入mp4文件保存路徑'

    download_m3u8_video(url, ts_file_path)
    convert_ts_to_mp4(ts_file_path, mp4_file_path)

在這個示例中,download_m3u8_video 函數用於下載 m3u8 視頻,convert_ts_to_mp4 函數用於將下載的 ts 文件轉換為 mp4 文件。首先,使用 requests 庫下載 m3u8 文件,並解析出其中的 ts 文件鏈接。然後,遍歷 ts 文件鏈接列表,使用 requests 庫下載每個 ts 文件,並將其寫入到一個文件中。最後,使用 ffmpeg 工具將下載的 ts 文件轉換為 mp4 文件。需要註意的是,為了使用 ffmpeg 工具,需要在系統中安裝 ffmpeg,並將其添加到環境變數中。

實際應用中,可以根據具體情況對代碼進行調整和優化,例如增加異常處理、優化下載速度等。同時,由於 m3u8 視頻格式的特殊性,下載過程可能會較為耗時,需要耐心等待一段時間。

使用多線程來優化下載速度

為了優化下載速度,可以使用多線程或非同步 IO 的方式來下載 m3u8 視頻。以下是使用多線程下載 m3u8 視頻的示例代碼:

import requests
import os
import threading

class Downloader(threading.Thread):
    def __init__(self, url, ts_url, file_path):
        threading.Thread.__init__(self)
        self.url = url
        self.ts_url = ts_url
        self.file_path = file_path

    def run(self):
        r = requests.get(self.ts_url, stream=True)
        if r.status_code == 200:
            with open(self.file_path, 'wb') as f:
                for chunk in r.iter_content(chunk_size=1024):
                    if chunk:
                        f.write(chunk)

def download_m3u8_video(url, file_path):
    r = requests.get(url)
    if r.status_code != 200:
        print('m3u8視頻下載鏈接無效')
        return False

    m3u8_list = r.text.split('\n')
    m3u8_list = [i for i in m3u8_list if i and i[0] != '#']

    ts_list = []
    for ts_url in m3u8_list:
        ts_url = url.rsplit('/', 1)[0] + '/' + ts_url
        ts_list.append(ts_url)

    threads = []
    for i, ts_url in enumerate(ts_list):
        ts_file_path = file_path.rsplit('.', 1)[0] + f'_{i}.ts'
        thread = Downloader(url, ts_url, ts_file_path)
        thread.start()
        threads.append(thread)

    for thread in threads:
        thread.join()

    print('m3u8視頻下載完成')
    return True

def convert_ts_to_mp4(ts_file_path, mp4_file_path):
    os.system(f'ffmpeg -i {ts_file_path} -c copy {mp4_file_path}')

if __name__ == '__main__':
    url = '輸入m3u8流媒體播放列表文件下載鏈接'
    ts_file_path = '輸入ts文件保存路徑'
    mp4_file_path = '輸入mp4文件保存路徑'

    download_m3u8_video(url, ts_file_path)
    convert_ts_to_mp4(ts_file_path, mp4_file_path)

在這個示例中,定義了一個 Downloader 類,用於下載每個 ts 文件。在 Downloader 類中,使用 requests 庫的 stream 參數將下載進度分塊,每次下載 1024 個位元組,然後寫入到文件中。在 download_m3u8_video 函數中,使用多線程的方式同時下載多個 ts 文件,並等待所有線程下載完成後再將其合併成一個 mp4 文件。這樣可以大大縮短下載時間。

需要註意的是,多線程下載可能會導致網路瓶頸,從而降低下載速度。因此,在實際應用中,需要根據具體情況選擇合適的下載方式,併進行調整和優化。例如,可以使用非同步 IO、協程等技術來優化下載速度。另外,為了提高下載速度,還可以使用 CDN、負載均衡、網路加速等技術來優化下載環節。

使用非同步 IO 和協程來優化下載速度

協程(Coroutine)是一種輕量級的線程,可以在單線程中實現多個任務的併發執行,從而提高程式的效率和性能。Python 中的協程是通過 async/await 關鍵字來實現的,可以使用 asyncio 庫來進行協程編程。

非同步 IO(Asynchronous IO)是一種非阻塞式 IO 模型,可以在進行 IO 操作時不會阻塞程式的執行,從而提高程式的效率和響應速度。Python 中的非同步 IO 是通過 asyncio 庫來實現的,可以使用 async/await 關鍵字和協程來實現非同步 IO 操作。

非同步 IO 和協程的結合可以實現高效的併發編程,通過非同步 IO 可以充分利用 CPU 和網路帶寬等資源,提高程式的效率和性能;而通過協程可以在單線程中實現多個任務的併發執行,避免了線程切換的開銷,從而提高程式的響應速度和併發性能。在實際應用中,我們可以根據具體情況選擇和優化非同步 IO 和協程的使用方式,以達到最佳的效果和性能。

為了使用非同步 IO 和協程來優化下載速度,可以使用 aiohttp 和 asyncio 庫來實現。以下是使用非同步 IO 和協程下載 m3u8 視頻的示例代碼:

import aiohttp
import asyncio
import os

async def download_ts_file(ts_url, ts_file_path):
    # 防止ssl報錯:
    # aiohttp.client_exceptions.ClientConnectorCertificateError: Cannot connect to host ***.****.com:443 ssl:True
    # [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local
    # issuer certificate (_ssl.c:1123)')]
    conn = aiohttp.TCPConnector(ssl=False)
    async with aiohttp.ClientSession(connector=conn) as session:
        async with session.get(ts_url) as response:
            if response.status != 200:
                print(f'{ts_url} 下載失敗')
                return False
            with open(ts_file_path, 'wb') as f:
                while True:
                    chunk = await response.content.read(1024)
                    if not chunk:
                        break
                    f.write(chunk)
    print(f'{ts_url} 下載完成')
    return True

async def download_m3u8_video(url, file_path):
    # 防止ssl報錯
    conn = aiohttp.TCPConnector(ssl=False)
    async with aiohttp.ClientSession(connector=conn) as session:
        async with session.get(url) as response:
            if response.status != 200:
                print('m3u8視頻下載鏈接無效')
                return False

            m3u8_text = await response.text()
            m3u8_list = m3u8_text.split('\n')
            m3u8_list = [i for i in m3u8_list if i and i[0] != '#']

            tasks = []
            for i, ts_url in enumerate(m3u8_list):
                ts_url = url.rsplit('/', 1)[0] + '/' + ts_url
                ts_file_path = file_path.rsplit('.', 1)[0] + f'_{i}.ts'
                task = asyncio.ensure_future(
                    download_ts_file(ts_url, ts_file_path))
                tasks.append(task)

            await asyncio.gather(*tasks)

    print('m3u8視頻下載完成')
    return True

def convert_ts_to_mp4(ts_file_path, mp4_file_path):
    os.system(f'ffmpeg -i {ts_file_path} -c copy {mp4_file_path}')

if __name__ == '__main__':
    url = '輸入m3u8流媒體播放列表文件下載鏈接'
    ts_file_path = '輸入ts文件保存路徑'
    mp4_file_path = '輸入mp4文件保存路徑'

    loop = asyncio.get_event_loop()
    loop.run_until_complete(download_m3u8_video(url, ts_file_path))
    convert_ts_to_mp4(ts_file_path, mp4_file_path)

在這個示例中,使用了 aiohttp 和 asyncio 庫來實現非同步 IO 和協程。定義了兩個協程函數:download_m3u8_videodownload_ts_file。在 download_m3u8_video 函數中,使用 aiohttp 庫的 ClientSession 類非同步獲取 m3u8 文件,並解析出其中的 ts 文件鏈接。然後,使用協程和非同步 IO 的方式非同步下載每個 ts 文件,並將其寫入到本地文件中。在下載過程中,使用了非同步 IO 和協程的方式,可以充分利用網路帶寬,提高下載速度。

download_m3u8_video 函數中,使用了 async for 迴圈來遍歷 m3u8 文件中的 ts 文件鏈接,並創建了一個任務列表 tasks,用於存儲非同步下載的任務。然後,使用 asyncio.ensure_future 方法將每個任務添加到任務列表中。最後,使用 asyncio.gather 方法同時運行所有非同步任務,等待所有任務完成後,即可完成整個 m3u8 視頻的下載。

最後,使用 ffmpeg 工具將下載的 ts 文件轉換為 mp4 格式的視頻文件。這個步驟並不涉及非同步 IO 和協程,只是為了將下載的 ts 文件轉換為可用的視頻文件格式。

使用協程可以充分利用網路帶寬,提高下載速度。需要註意的是,在使用協程時,需要考慮到 CPU 和記憶體等資源的占用,避免出現資源耗盡或者死鎖等問題。同時,協程的使用需要掌握一定的非同步編程技巧,例如使用 async/await 關鍵字、協程調度等。因此,在實際應用中,需要根據具體情況進行調整和優化,以獲取最佳的性能和效果。

作者:飛仔FeiZai

出處:https://www.cnblogs.com/yuzhihui/p/17443299.html

聲明:歡迎任何形式的轉載,但請務必註明出處!!!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • # java註解與反射 - java註解與反射十分重要,是很多框架的底層 ## 註解(Annotataion) - 註解的作用: 1. 不是程式本身,可以對程式作出解釋 1. 可以被其他程式讀取 - 註解的格式:@註釋名,如@override表示重寫方法,而且有些還可以添加一些參數值,如@Suppr ...
  • > 本文首發於公眾號:Hunter後端 > 原文鏈接:[Python連接es筆記三之es更新操作](https://mp.weixin.qq.com/s/1cTaVfjLFrmbXajNcayhEA) 這一篇筆記介紹如何使用 Python 對數據進行更新操作。 對於 es 的更新的操作,不用到 Se ...
  • 哈嘍大家好今天咱們來實現一下批量下載ts格式文件後,如何合併為MP4視頻。 ts文件下載 網頁文件下載其實都可以通過requests.get以文件流的形式獲取,並以位元組的形式寫入本地文件即可。代碼如下: import os import requests # Python學習資料白嫖扣裙:70852 ...
  • > 40億個QQ號,限制1G記憶體,如何去重? 40億個unsigned int,如果直接用記憶體存儲的話,需要: `4*4000000000 /1024/1024/1024 = 14.9G` ,考慮到其中有一些重覆的話,那1G的空間也基本上是不夠用的。 想要實現這個功能,可以藉助點陣圖。 使用點陣圖的話, ...
  • ### 選擇代碼區 1. ctrl w - 如果放到以if開頭的語句,可以選擇if判斷條件所在的代碼片段 - 游標在單個單詞下時 選擇單詞 - 在選中多個單詞時,選擇整個字元串 - 三次點擊時,如果不在字元串單詞下,用於選擇{}內的代碼片段 逐級遞增 如果在單詞下方,用於選擇單詞所在的字元串並且向外 ...
  • 1.curl 方式 curl -v -u admin:geoserver -H "Content-type: application/json" -d "{'seedRequest':{'name':'NR:tdbp','bounds':{'coords':{ 'double':[ '108.790 ...
  • [官方文檔](https://numpy.org/doc/stable/reference/generated/numpy.bincount.html#numpy-bincount) `out = np.bincount(x[, weights, minlength])` **該函數用於統計輸入數組 ...
  • 面試題==知識點,這裡所記錄的面試題並不針對於面試者,而是將這些面試題作為技能知識點來看待。不以刷題進大廠為目的,而是以學習為目的。這裡的知識點會持續更新,目錄也會隨時進行調整。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...