全場景AI推理引擎MindSpore Lite, 助力HMS Core視頻編輯服務打造更智能的剪輯體驗

来源:https://www.cnblogs.com/hmscore/archive/2022/04/29/16206087.html
-Advertisement-
Play Games

移動互聯網的發展給人們的社交和娛樂方式帶來了很大的改變,以vlog、短視頻等為代表的新興文化樣態正受到越來越多人的青睞。同時,隨著AI智能、美顏修圖等功能在圖像視頻編輯App中的應用,促使視頻編輯效率和視頻效果得到了很大的提升,也讓視頻應用場景更加豐富。 當前剪輯產品功能多樣、素材豐富,但是開發周期 ...


移動互聯網的發展給人們的社交和娛樂方式帶來了很大的改變,以vlog、短視頻等為代表的新興文化樣態正受到越來越多人的青睞。同時,隨著AI智能、美顏修圖等功能在圖像視頻編輯App中的應用,促使視頻編輯效率和視頻效果得到了很大的提升,也讓視頻應用場景更加豐富。

當前剪輯產品功能多樣、素材豐富,但是開發周期較長、門檻較高。為了讓剪輯軟體更加智能、簡單易用,提升開發者的效率,HMS Core 6為開發者提供視頻編輯服務(Video Editor Kit),提供視頻導入、編輯、渲染、導出、媒資管理等一站式視頻處理能力。除了支持完整的傳統視頻編輯功能,視頻編輯服務還提供了諸如專屬濾鏡、人物追蹤、一鍵染髮等豐富的AI處理能力輔助視頻創作,為用戶帶來更加暢快的創作靈感,打造更加智能的剪輯體驗。


圖1. 基於AI能力的專屬濾鏡、人物追蹤、一鍵染髮效果展示

多樣化的智能視頻處理能力是由一個個神經網路模型實現的,由於訓練好的模型文件較大(單個模型大小一般為十幾甚至幾十兆),而手機等設備ROM和RAM空間大小有限,如何以更少的終端設備空間占用為開發者提供更豐富的智能化視頻處理能力,成為移動應用視頻編輯面臨的一大挑戰。

為解決以上挑戰,HMS Core視頻編輯服務選擇使用華為自研AI框架MindSpore Lite進行神經網路模型推理。MindSpore Lite是一款全場景AI推理引擎,通過統一API介面支持在端、邊、雲的不同環境快速部署,支持HarmonyOS、Android、iOS、Windows等多種操作系統,支持Ascend、GPU、CPU(x86、arm……)等多種硬體執行。除支持MindSpore訓練出的模型格式,MindSpore Lite還支持TensorFlow,TensorFlow Lite、Caffe、ONNX等第三方模型格式的轉換及推理。


圖2. MindSpore Lite架構圖

MindSpore Lite為AI模型推理提供高性能和超輕量的解決方案:通過高效的內核演算法和彙編級優化,以及CPU、GPU、NPU的異構調度,可以充分發揮硬體算力,實現最小化推理時延和功耗;提供模型量化壓縮技術,採用訓練後量化(Post-Training Quantization, PTQ),無需數據集即可直接將權重數據從浮點型映射到低比特的定點數據,有效降低模型大小,助力AI模型在資源受限環境下的部署執行。


圖3. 量化技術原理介紹

針對權重數據的量化支持固定比特量化和混合比特量化兩種形式。固定比特量化採用Bit-Packing的方式,支持1-16任意比特的權重量化,滿足用戶在不同壓縮場景下的要求,同時針對模型量化後的數據分佈情況,自動選擇合適的編碼策略進行壓縮編碼,從而達到最優的壓縮效果。


圖4. 固定比特量化壓縮

混合比特量化根據神經網路不同層對量化損失的敏感度不同的特點,採用均方誤差作為優化目標,自動搜索出最適合當前層的比特位,在保證精度的同時實現更大的壓縮率。同時針對量化後的模型,採用有限狀態熵(Finite State Entropy, FSE)對量化後的權重數據進行熵編碼進一步壓縮,實現對模型的高效壓縮,提升模型傳輸速率和減少模型存儲空間。


圖5. 混合比特量化壓縮

除此之外,量化時還會採用Bias Correction的方式,最小化其量化誤差。Bias Correction會根據權重數據固有的統計學特性,反量化時對其進行校準,使權重值量化前後具有相同的期望和方差,能夠大幅度提高模型精度。
視頻編輯服務中的AI模型採用MindSpore Lite提供的混合比特量化方式,最終在保證精度的同時達到了平均5x+的模型壓縮效果,例如一鍵染髮的模型從原來的20.86M壓縮到3.76M,有效解決了模型過多、文件過大導致的部署困難問題。


圖6. 視頻編輯模型量化效果(來源於MindSpore Lite實測數據)

通過對AI模型的量化壓縮,在ROM空間占用不變的前提下,保障剪輯產品可以部署更多的AI模型,充分發揮AI能力來提供更多的特效應用場景,使得剪輯功能更加強大、更加智能。華為官方剪輯軟體花瓣剪輯在接入視頻編輯服務能力後,用戶可通過使用專屬濾鏡、人物追蹤等AI視頻剪輯功能(部分特性隨花瓣剪輯App升級陸續開放),讓視頻剪輯更便捷和更富有趣味性。

MindSpore Lite致力於打造高性能、超輕量級的全場景 AI引擎,除高性能內核演算法及硬體異構調度、量化壓縮之外,還提供端雲協同的一站式訓練和推理能力。HMS Core視頻編輯服務基於MindSpore Lite,助力開發者打造更加易用且智能的剪輯工具。

欲瞭解更多信息,歡迎訪問官網

華為開發者聯盟HMS Core官網

MindSpore官網

MindSpore開源社區


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 鏡像下載、功能變數名稱解析、時間同步請點擊 阿裡雲開源鏡像站 一、在兩台機器上安裝docker // 1.安裝Docker源 yum install -y wget && wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.rep ...
  • 前言 由於CentOS 8的支持已經到期了,.NET 6也不支持了,然後也無法升級,導致使用起來已經非常不便,無奈只有遷移伺服器這個選項了。 選擇發行版本一直是一個比較頭疼的問題,首先我不是專門運維的,最好使用的人比較多的版本,然後.NET要官方支持的版本才行,最好是具有中國區的鏡像服務。雖然Fed ...
  • ** linux 下需要知道你系統的Linux內核版本,然後選擇相應的版本下載,版本查詢命令:** uname -a 在高版本20.04和18.04等版本,不需要執行下麵這條命令來編譯makefile文件,因為系統自身存在串口驅動cp210x.o make 於是只需要在[/lib/modules/5 ...
  • 最近需要使用mysql8.0版本,但是原本的mysql5.7版本已經被多個服務依賴,於是想想能不能同一臺伺服器裝多個版本的mysql,一查確實可行,這裡做一個記錄方便自己後期回憶 閱讀本文前請註意!!! 本文是幫助您建立在mysql5.7版本已經安裝完成併在運行中,另外安裝配置mysql8.0版本 ...
  • 事務概述 當多個用戶訪問同一份數據時,一個用戶在更改數據的過程中,可能有其他用戶同時發起更改請求,為保證資料庫記錄的更新從一個一致性狀態變為另外一個一致性狀態,使用事務處理是非常必要的,事務具有以下四個特性: 原子性(Atomicity):事務中所有操作視為一個原子單位,即對事務所進行的數據修改等操 ...
  • Hadoop是什麼 大白話,Hadoop是個存儲數據,計算數據的分散式框架。核心組件是HDFS、MapReduce、Yarn。 HDFS:分散式存儲 MapReduce:分散式計算 Yarn:調度MapReduce 現在為止我們知道了HDFS、MapReduce、Yarn是幹啥的,下麵通過一張圖再來 ...
  • Mysql 連續數據分組 思路是使用變數 逐行將上行和當前行進行對比 條件滿足則生成分組的編號,再根據分組條件和分組編號分組就可以。 ...
  • 主從複製 這是《Redis設計與實現》系列的文章,系列導航:Redis設計與實現筆記 SLAVEOF 新舊複製功能 舊版複製功能 舊版複製功能的實現為 同步 和 命令傳播: 當剛連上Master時,要做一次全同步: sequenceDiagram participant Slave particip ...
一周排行
    -Advertisement-
    Play Games
  • 什麼是工廠模式 工廠模式是最常用的設計模式之一,屬於創建型模式。 有點: 解耦,可以把對象的創建和過程分開 減少代碼量,易於維護 什麼時候用? 當一個抽象類有多個實現的時候,需要多次實例化的時候,就要考慮使用工廠模式。 比如:登錄的抽象類ILoginBusiness,它有2個實現,一個用用戶名密碼登 ...
  • 這次iNeuOS升級主要升級圖形渲染引擎和增加豐富的圖元信息,可以很快的方案應用。總共增加41個通用和行業領域的圖元應用,增加2154個圖元信息,現在iNeuOS視圖建模功能模塊總共包括5894個行業圖元信息。現在完全支持製作高保真的工藝流程和大屏展示效果。 ...
  • 效果圖先附上: 首先 這是我是參考 教程:使用 SignalR 2 和 MVC 5 實時聊天 | Microsoft Docs 先附上教程: 在“添加新項 - SignalRChat”中,選擇 InstalledVisual> C#>WebSignalR>,然後選擇 SignalR Hub 類 (v ...
  • 一、前言 項目中之前涉及到胎兒心率圖曲線的繪製,最近項目中還需要添加心電曲線和血樣曲線的繪製功能。今天就來分享一下心電曲線的繪製方式; 二、正文 1、胎兒心率曲線的繪製是通過DrawingVisual來實現的,這裡的心電曲線我也是採用差不多相同的方式來實現的,只是兩者曲線的數據有所區別。心電圖的數據 ...
  • 安裝 Redis # 首先安裝依賴gcc, 後面需要使用make編譯redis yum install gcc -y # 進入 /usr/local/src 目錄, 把源碼下載到這裡 cd /usr/local/src # 下載 redis 7.0.2 的源碼,github被牆,可以使用國內的地址 ...
  • Redis 的定義? 百度百科: Redis(Remote Dictionary Server ),即遠程字典服務,是一個開源的使用ANSI C語言編寫、支持網路、可基於記憶體亦可持久化的日誌型、Key-Value資料庫,並提供多種語言的API。 中文官網: Redis是一個開源(BSD許可),記憶體存 ...
  • 事情的起因是收到了一位網友的請求,他的java課設需要設計實現迷宮相關的程式——如標題概括。 我這邊不方便透露相關信息,就只把任務要求寫出來。 演示視頻指路👉: 基於JavaFX圖形界面的迷宮程式演示_嗶哩嗶哩_bilibili 完整代碼鏈接🔎: 網盤:https://pan.baidu.com ...
  • Python中的字典 Python中的字典是另一種可變容器模型,且可存儲任意類型對象。鍵值使用冒號分割,你可以看成是一串json。 常用方法 獲取字典中的值 dict[key] 如果key不存在會報錯,建議使用dict.get(key),不存在返回None 修改和新建字典值 dict[key]=va ...
  • 迎面走來了你的面試官,身穿格子衫,挺著啤酒肚,髮際線嚴重後移的中年男子。 手拿泡著枸杞的保溫杯,胳膊夾著MacBook,MacBook上還貼著公司標語:“加班使我快樂”。 面試官: 看你簡歷上用過MySQL,問你幾個簡單的問題吧。什麼是聚簇索引和非聚簇索引? 這個問題難不住我啊。來之前我看一下一燈M ...
  • tunm二進位協議在python上的實現 tunm是一種對標JSON的二進位協議, 支持JSON的所有類型的動態組合 支持的數據類型 基本支持的類型 "u8", "i8", "u16", "i16", "u32", "i32", "u64", "i64", "varint", "float", "s ...