Python實現視頻自動打碼功能

来源:https://www.cnblogs.com/hahaa/archive/2022/04/08/16118203.html
-Advertisement-
Play Games

我們在觀看視頻的時候,有時候會出現一些奇怪的馬賽克,影響我們的觀影體驗,那麼這些馬賽克是如何精確的加上去的呢? 本次我們就來用Python實現對視頻自動打碼! 準備工作 環境咱們還是使用 Python3.8 和 pycharm2021 即可 實現原理 將視頻分為音頻和畫面; 畫面中出現人臉和目標比對 ...


我們在觀看視頻的時候,有時候會出現一些奇怪的馬賽克,影響我們的觀影體驗,那麼這些馬賽克是如何精確的加上去的呢?


本次我們就來用Python實現對視頻自動打碼!

準備工作

環境咱們還是使用 Python3.8 和 pycharm2021 即可

實現原理

  1. 將視頻分為音頻和畫面;
  2. 畫面中出現人臉和目標比對,相應人臉進行打碼;
  3. 處理後的視頻添加聲音;

模塊

手動安裝一下 cv2 模塊 ,pip install opencv-python 安裝

素材工具

我們需要安裝一下 ffmpeg 音視頻轉碼工具

代碼解析

導入需要使用的模塊

import cv2  
import face_recognition  # 人臉識別庫  99.7%    cmake  dlib  face_recognition
import subprocess

# python學習資料、本項目素材加群 815624229 免費領取 

將視頻轉為音頻

def video2mp3(file_name):
    """
    :param file_name: 視頻文件路徑
    :return:
    """
    outfile_name = file_name.split('.')[0] + '.mp3'
    cmd = 'ffmpeg -i ' + file_name + ' -f mp3 ' + outfile_name
    print(cmd)
    subprocess.call(cmd, shell=False)

 

打碼

def mask_video(input_video, output_video, mask_path='mask.jpg'):
    """
    :param input_video: 需打碼的視頻
    :param output_video: 打碼後的視頻
    :param mask_path: 打碼圖片
    :return:
    """
    # 讀取圖片
    mask = cv2.imread(mask_path)
    # 讀取視頻
    cap = cv2.VideoCapture(input_video)
    # 視頻  fps  width  height
    v_fps = cap.get(5)
    v_width = cap.get(3)
    v_height = cap.get(4)

    # 設置寫入視頻參數  格式MP4
    # 畫面大小
    size = (int(v_width), int(v_height))
    fourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')

    # 輸出視頻
    out = cv2.VideoWriter(output_video, fourcc, v_fps, size)

    # 已知人臉
    known_image = face_recognition.load_image_file('tmr.jpg')
    biden_encoding = face_recognition.face_encodings(known_image)[0]

    cap = cv2.VideoCapture(input_video)

    while (cap.isOpened()):
        ret, frame = cap.read()
        if ret:
            # 檢測人臉
            # 人臉區域
            face_locations = face_recognition.face_locations(frame)

            for (top_right_y, top_right_x, left_bottom_y, left_bottom_x) in face_locations:
                print((top_right_y, top_right_x, left_bottom_y, left_bottom_x))
                unknown_image = frame[top_right_y - 50:left_bottom_y + 50, left_bottom_x - 50:top_right_x + 50]
                if face_recognition.face_encodings(unknown_image) != []:
                    unknown_encoding = face_recognition.face_encodings(unknown_image)[0]

                    # 對比人臉
                    results = face_recognition.compare_faces([biden_encoding], unknown_encoding)
                    # [True]
                    # 貼圖
                    if results == [True]:
                        mask = cv2.resize(mask, (top_right_x - left_bottom_x, left_bottom_y - top_right_y))
                        frame[top_right_y:left_bottom_y, left_bottom_x:top_right_x] = mask
            out.write(frame)


        else:
            break

 

音頻添加到畫面

def video_add_mp3(file_name, mp3_file):
    """
    :param file_name: 視頻畫面文件
    :param mp3_file:  視頻音頻文件
    :return:
    """
    outfile_name = file_name.split('.')[0] + '-f.mp4'
    subprocess.call('ffmpeg -i ' + file_name + ' -i ' + mp3_file + ' -strict -2 -f mp4 ' + outfile_name, shell=False)

 

完整代碼

import cv2 
import face_recognition  # 人臉識別庫  99.7%    cmake  dlib  face_recognition
import subprocess

def video2mp3(file_name):

    outfile_name = file_name.split('.')[0] + '.mp3'
    cmd = 'ffmpeg -i ' + file_name + ' -f mp3 ' + outfile_name
    print(cmd)
    subprocess.call(cmd, shell=False)


def mask_video(input_video, output_video, mask_path='mask.jpg'):

    # 讀取圖片
    mask = cv2.imread(mask_path)
    # 讀取視頻
    cap = cv2.VideoCapture(input_video)
    # 視頻  fps  width  height
    v_fps = cap.get(5)
    v_width = cap.get(3)
    v_height = cap.get(4)

    # 設置寫入視頻參數  格式MP4
    # 畫面大小
    size = (int(v_width), int(v_height))
    fourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')

    # 輸出視頻
    out = cv2.VideoWriter(output_video, fourcc, v_fps, size)

    # 已知人臉
    known_image = face_recognition.load_image_file('tmr.jpg')
    biden_encoding = face_recognition.face_encodings(known_image)[0]

    cap = cv2.VideoCapture(input_video)

    while (cap.isOpened()):
        ret, frame = cap.read()
        if ret:
            # 檢測人臉
            # 人臉區域
            face_locations = face_recognition.face_locations(frame)

            for (top_right_y, top_right_x, left_bottom_y, left_bottom_x) in face_locations:
                print((top_right_y, top_right_x, left_bottom_y, left_bottom_x))
                unknown_image = frame[top_right_y - 50:left_bottom_y + 50, left_bottom_x - 50:top_right_x + 50]
                if face_recognition.face_encodings(unknown_image) != []:
                    unknown_encoding = face_recognition.face_encodings(unknown_image)[0]

                    # 對比人臉
                    results = face_recognition.compare_faces([biden_encoding], unknown_encoding)
                    # [True]
                    # 貼圖
                    if results == [True]:
                        mask = cv2.resize(mask, (top_right_x - left_bottom_x, left_bottom_y - top_right_y))
                        frame[top_right_y:left_bottom_y, left_bottom_x:top_right_x] = mask
            out.write(frame)


        else:
            break


def video_add_mp3(file_name, mp3_file):

    outfile_name = file_name.split('.')[0] + '-f.mp4'
    subprocess.call('ffmpeg -i ' + file_name + ' -i ' + mp3_file + ' -strict -2 -f mp4 ' + outfile_name, shell=False)


if __name__ == '__main__':
    # 1.
    video2mp3('cut.mp4')
    # 2.
    mask_video(input_video='cut.mp4',output_video='output.mp4')
    # 3.
    video_add_mp3(file_name='output.mp4',mp3_file='cut.mp3')

 

兄弟們,快去試試吧!

歡迎在評論區討論交流~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ELK 基本概述 ELK是Elasticsearch、Logstash、Kibana的簡稱,常常用於部署分散式系統日誌服務。 Elasticsearch:全球實時全文搜索和分析引擎,提供搜集、分析、存儲數據三大功能;是一套開放REST和JAVA API等結構提供高效搜索功能,可擴展的分散式系統。它構 ...
  • Mysql主從環境概述 Mysql集群主從環境搭建 本次採用Docker部署集群,並且首先主從實例配置。 1.Mysql-Cluster集群服務規劃 2.Mysql-Cluster集群先決條件 創建 Mysql-Cluster集群主要配置目錄如下: 2.1 Mysql-Master節點[3308] ...
  • We are not here because we are free .we are here because we are not free. 我們在這裡不是因為我們自由,我們在這裡是因為我們不自由。——《黑客帝國》 寫在開頭 在這個互聯網最美好的時代,隨著業務產品線的增多,業務應用平臺逐漸增多 ...
  • Qt 實現文字輸入框,帶字數限制 核心構思 核心的點在於,限制輸入的字數;主要的方法為創建一個組合視窗 textChanged 這個信號,會在你輸入字元之後發射,可以連接這個信號,在發射了信號之後,去獲取當前QTextEdit里的內容,獲取數量,然後根據最大數量,來選擇是不是需要截取文本; 游標的移 ...
  • 一、我們在python語言中 常用@classmethod、@staticmethod這個裝飾器,裝飾器的作用簡單來講就是我們在很多地方可能都會用到一下相同的功能,這時我們會有兩種想法。 1. 將這部分相同的功能封裝成函數,然後在使用這個功能的時候程式中調用這個函數。 2. 將這部分相同的功能封裝成 ...
  • 一直以來,中式占卜都是基於算命先生手工實現,程式繁瑣(往往需要沐浴、計算天時、靜心等等流程)。準備工作複雜(通常需要銅錢等道具),計算方法複雜,需要純手工計算二進位並轉換為最終的卦象,為瞭解決這個問題,筆者基於python實現了一套科學算命工具,用於快速進行占卜。 本文的算命方式採用八卦 + 周易+ ...
  • RPC及Dubbo和ZooKeeper的安裝 RPC 通信有兩種方式:HTTP(無狀態協議,通信協議),RPC(遠程過程調用) 它兩的本質沒有區別,只是功能有點不一樣 官方解釋: RPC是指遠程過程調用,是一種進程間通信方式,他是一種技術的思想,而不是規範,它允許程式調用另一個地址空間的過程和函數, ...
  • 前言 和換臉演算法的簡單粗暴相比,人臉融合演算法就要彈性的多。顧名思義,人臉融合是對兩張人臉進行融合處理,生成的人臉同時具 備兩張人臉的外貌特征。人臉融合有什麼實際意義呢?一個簡單的應用就是用父母雙方的臉部圖片融合,得到未來孩子可能的長相。 本文通過百度AI開放平臺的人臉融合功能來做一個簡單的試驗。 前 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...