Python實現視頻自動打碼功能

-Advertisement-

我們在觀看視頻的時候，有時候會出現一些奇怪的馬賽克，影響我們的觀影體驗，那麼這些馬賽克是如何精確的加上去的呢？本次我們就來用Python實現對視頻自動打碼！準備工作環境咱們還是使用 Python3.8 和 pycharm2021 即可實現原理將視頻分為音頻和畫面；畫面中出現人臉和目標比對 ...

我們在觀看視頻的時候，有時候會出現一些奇怪的馬賽克，影響我們的觀影體驗，那麼這些馬賽克是如何精確的加上去的呢？

本次我們就來用Python實現對視頻自動打碼！

準備工作

環境咱們還是使用 Python3.8 和 pycharm2021 即可

實現原理

將視頻分為音頻和畫面；
畫面中出現人臉和目標比對，相應人臉進行打碼；
處理後的視頻添加聲音；

模塊

手動安裝一下 cv2 模塊，pip install opencv-python 安裝

素材工具

我們需要安裝一下 ffmpeg 音視頻轉碼工具

代碼解析

導入需要使用的模塊

import cv2  
import face_recognition  # 人臉識別庫  99.7%    cmake  dlib  face_recognition
import subprocess

# python學習資料、本項目素材加群 815624229 免費領取

將視頻轉為音頻

def video2mp3(file_name):
    """
    :param file_name: 視頻文件路徑
    :return:
    """
    outfile_name = file_name.split('.')[0] + '.mp3'
    cmd = 'ffmpeg -i ' + file_name + ' -f mp3 ' + outfile_name
    print(cmd)
    subprocess.call(cmd, shell=False)

打碼

def mask_video(input_video, output_video, mask_path='mask.jpg'):
    """
    :param input_video: 需打碼的視頻
    :param output_video: 打碼後的視頻
    :param mask_path: 打碼圖片
    :return:
    """
    # 讀取圖片
    mask = cv2.imread(mask_path)
    # 讀取視頻
    cap = cv2.VideoCapture(input_video)
    # 視頻  fps  width  height
    v_fps = cap.get(5)
    v_width = cap.get(3)
    v_height = cap.get(4)

    # 設置寫入視頻參數  格式MP4
    # 畫面大小
    size = (int(v_width), int(v_height))
    fourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')

    # 輸出視頻
    out = cv2.VideoWriter(output_video, fourcc, v_fps, size)

    # 已知人臉
    known_image = face_recognition.load_image_file('tmr.jpg')
    biden_encoding = face_recognition.face_encodings(known_image)[0]

    cap = cv2.VideoCapture(input_video)

    while (cap.isOpened()):
        ret, frame = cap.read()
        if ret:
            # 檢測人臉
            # 人臉區域
            face_locations = face_recognition.face_locations(frame)

            for (top_right_y, top_right_x, left_bottom_y, left_bottom_x) in face_locations:
                print((top_right_y, top_right_x, left_bottom_y, left_bottom_x))
                unknown_image = frame[top_right_y - 50:left_bottom_y + 50, left_bottom_x - 50:top_right_x + 50]
                if face_recognition.face_encodings(unknown_image) != []:
                    unknown_encoding = face_recognition.face_encodings(unknown_image)[0]

                    # 對比人臉
                    results = face_recognition.compare_faces([biden_encoding], unknown_encoding)
                    # [True]
                    # 貼圖
                    if results == [True]:
                        mask = cv2.resize(mask, (top_right_x - left_bottom_x, left_bottom_y - top_right_y))
                        frame[top_right_y:left_bottom_y, left_bottom_x:top_right_x] = mask
            out.write(frame)


        else:
            break

音頻添加到畫面

def video_add_mp3(file_name, mp3_file):
    """
    :param file_name: 視頻畫面文件
    :param mp3_file:  視頻音頻文件
    :return:
    """
    outfile_name = file_name.split('.')[0] + '-f.mp4'
    subprocess.call('ffmpeg -i ' + file_name + ' -i ' + mp3_file + ' -strict -2 -f mp4 ' + outfile_name, shell=False)

完整代碼

import cv2 
import face_recognition  # 人臉識別庫  99.7%    cmake  dlib  face_recognition
import subprocess

def video2mp3(file_name):

    outfile_name = file_name.split('.')[0] + '.mp3'
    cmd = 'ffmpeg -i ' + file_name + ' -f mp3 ' + outfile_name
    print(cmd)
    subprocess.call(cmd, shell=False)


def mask_video(input_video, output_video, mask_path='mask.jpg'):

    # 讀取圖片
    mask = cv2.imread(mask_path)
    # 讀取視頻
    cap = cv2.VideoCapture(input_video)
    # 視頻  fps  width  height
    v_fps = cap.get(5)
    v_width = cap.get(3)
    v_height = cap.get(4)

    # 設置寫入視頻參數  格式MP4
    # 畫面大小
    size = (int(v_width), int(v_height))
    fourcc = cv2.VideoWriter_fourcc('m', 'p', '4', 'v')

    # 輸出視頻
    out = cv2.VideoWriter(output_video, fourcc, v_fps, size)

    # 已知人臉
    known_image = face_recognition.load_image_file('tmr.jpg')
    biden_encoding = face_recognition.face_encodings(known_image)[0]

    cap = cv2.VideoCapture(input_video)

    while (cap.isOpened()):
        ret, frame = cap.read()
        if ret:
            # 檢測人臉
            # 人臉區域
            face_locations = face_recognition.face_locations(frame)

            for (top_right_y, top_right_x, left_bottom_y, left_bottom_x) in face_locations:
                print((top_right_y, top_right_x, left_bottom_y, left_bottom_x))
                unknown_image = frame[top_right_y - 50:left_bottom_y + 50, left_bottom_x - 50:top_right_x + 50]
                if face_recognition.face_encodings(unknown_image) != []:
                    unknown_encoding = face_recognition.face_encodings(unknown_image)[0]

                    # 對比人臉
                    results = face_recognition.compare_faces([biden_encoding], unknown_encoding)
                    # [True]
                    # 貼圖
                    if results == [True]:
                        mask = cv2.resize(mask, (top_right_x - left_bottom_x, left_bottom_y - top_right_y))
                        frame[top_right_y:left_bottom_y, left_bottom_x:top_right_x] = mask
            out.write(frame)


        else:
            break


def video_add_mp3(file_name, mp3_file):

    outfile_name = file_name.split('.')[0] + '-f.mp4'
    subprocess.call('ffmpeg -i ' + file_name + ' -i ' + mp3_file + ' -strict -2 -f mp4 ' + outfile_name, shell=False)


if __name__ == '__main__':
    # 1.
    video2mp3('cut.mp4')
    # 2.
    mask_video(input_video='cut.mp4',output_video='output.mp4')
    # 3.
    video_add_mp3(file_name='output.mp4',mp3_file='cut.mp3')

兄弟們，快去試試吧！

歡迎在評論區討論交流~

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Linux系統Centos7 基於Docker搭建ELK分散式日誌系統

ELK 基本概述 ELK是Elasticsearch、Logstash、Kibana的簡稱，常常用於部署分散式系統日誌服務。 Elasticsearch：全球實時全文搜索和分析引擎，提供搜集、分析、存儲數據三大功能；是一套開放REST和JAVA API等結構提供高效搜索功能，可擴展的分散式系統。它構 ...
Mysql資料庫 | 基於Docker搭建Mysql-8.0以上版本主從實例實戰

Mysql主從環境概述 Mysql集群主從環境搭建本次採用Docker部署集群,並且首先主從實例配置。 1.Mysql-Cluster集群服務規劃 2.Mysql-Cluster集群先決條件創建 Mysql-Cluster集群主要配置目錄如下： 2.1 Mysql-Master節點[3308] ...
spring boot-admin 監控中心配置登錄密碼

We are not here because we are free .we are here because we are not free. 我們在這裡不是因為我們自由，我們在這裡是因為我們不自由。——《黑客帝國》寫在開頭在這個互聯網最美好的時代，隨著業務產品線的增多，業務應用平臺逐漸增多 ...
Qt 實現文字輸入框，帶字數限制

Qt 實現文字輸入框，帶字數限制核心構思核心的點在於，限制輸入的字數；主要的方法為創建一個組合視窗 textChanged 這個信號，會在你輸入字元之後發射，可以連接這個信號，在發射了信號之後，去獲取當前QTextEdit里的內容，獲取數量，然後根據最大數量，來選擇是不是需要截取文本；游標的移 ...
python中字元串、列表訪問

一、我們在python語言中常用@classmethod、@staticmethod這個裝飾器，裝飾器的作用簡單來講就是我們在很多地方可能都會用到一下相同的功能，這時我們會有兩種想法。 1. 將這部分相同的功能封裝成函數，然後在使用這個功能的時候程式中調用這個函數。 2. 將這部分相同的功能封裝成 ...
利用PYTHON實現科學占卜

一直以來，中式占卜都是基於算命先生手工實現，程式繁瑣（往往需要沐浴、計算天時、靜心等等流程）。準備工作複雜（通常需要銅錢等道具），計算方法複雜，需要純手工計算二進位並轉換為最終的卦象，為瞭解決這個問題，筆者基於python實現了一套科學算命工具，用於快速進行占卜。本文的算命方式採用八卦 + 周易+ ...
RPC及Dubbo和ZooKeeper的安裝

RPC及Dubbo和ZooKeeper的安裝 RPC 通信有兩種方式：HTTP（無狀態協議，通信協議），RPC（遠程過程調用）它兩的本質沒有區別，只是功能有點不一樣官方解釋： RPC是指遠程過程調用，是一種進程間通信方式，他是一種技術的思想，而不是規範，它允許程式調用另一個地址空間的過程和函數， ...
Python人臉融合告訴你，你的下一代長啥樣

前言和換臉演算法的簡單粗暴相比，人臉融合演算法就要彈性的多。顧名思義，人臉融合是對兩張人臉進行融合處理，生成的人臉同時具備兩張人臉的外貌特征。人臉融合有什麼實際意義呢？一個簡單的應用就是用父母雙方的臉部圖片融合，得到未來孩子可能的長相。本文通過百度AI開放平臺的人臉融合功能來做一個簡單的試驗。前 ...