京東小程式接入ARVR的技術方案和性能調優

来源:https://www.cnblogs.com/Jcloud/archive/2023/04/23/17345515.html
-Advertisement-
Play Games

京東小程式是一個開放技術平臺,正在被越來越多的頭部品牌選擇,用於站內私域流量的營銷和運營。諸如各種日化、奢侈品等品牌對ARVR有較多的訴求,希望京東小程式引擎提供一些底層能力,疊加品牌自主的個性化開發和定製,以支持更加豐富的場景和玩法,比如AR試妝、試戴等。 ...


作者:京東零售 戴旭

京東小程式是一個開放技術平臺,正在被越來越多的頭部品牌選擇,用於站內私域流量的營銷和運營。諸如各種日化、奢侈品等品牌對ARVR有較多的訴求,希望京東小程式引擎提供一些底層能力,疊加品牌自主的個性化開發和定製,以支持更加豐富的場景和玩法,比如AR試妝、試戴等。

我們小程式引擎聯合ARVR團隊,在雙方產研測的努力和協作下,完成了相關能力的設計和開發。整體功能於京東APP11.6.6版本發佈上線,期待為更多的商家和品牌賦能。

體驗路徑和效果(負責相關模塊的產品小姐姐友情錄屏)

技術方案

這裡以人臉識別為例,先介紹整體的技術方案。

概念介紹

技術關鍵詞:相機、實時幀、AR演算法、同層渲染、WebGL。

這幾個關鍵詞裡面,前三個比較好理解,人臉識別,會用相機採集人臉的實時幀數據,調用AR演算法,獲取計算結果,把數據傳輸給小程式前端。

後面兩個關鍵詞和小程式的場景有關係,WebGL技術是小程式為了支持游戲、ARVR等高性能渲染的需求,採用原生的OpenGL實現了一套WebGL的介面。小程式頁面是WebView渲染,而我們既然提到了採用OpenGL原生渲染,就需要把原生組件,正確的插入到Web的視圖層級,同層渲染就是將原生組件和WebView DOM 元素放在一起進行混合渲染的技術,能夠保證原生組件和 DOM 元素在渲染層級、滾動、觸摸事件處理等方面保持一致。

總體流程

小程式引擎在底層原生支持了相機、實時幀、AR、WebGL等能力,同時暴露了若幹 js 的api。小程式開發者通過相關api的調用,執行開啟相機、獲取實時幀數據,調用AR介面,獲取計算結果數據,進行WebGL渲染等操作。簡要的流程如下:

分層設計

從分層的角度看整個技術方案的設計,大致如下:

其中在AR引擎這一層,分為內置和外部AR引擎,也是由於小程式本身是開放的技術平臺,我們採用了介面協議化的設計,支持第三方宿主採用自主的AR引擎,同時提供了相機、實時幀、WebGL等原子化能力,小程式服務商可以構建專有的AR引擎為上層業務賦能。

技術挑戰

WebGL技術原理的篇幅過大,它也不僅僅是為了ARVR這個場景服務,所以包括AR演算法之內,都不在本篇的詳細介紹範圍之內。

在這部分,我們專註於小程式和ARVR疊加的領域:記憶體和幀率的優化。

我們知道在欣賞電視和電影畫面時,只要畫面刷新率達到24幀/秒,就能滿足人們的需求,也就是說我們至少要在中端甚至中低端的機器上達到24幀以上的幀率。

為了保證基本的畫質,相機實時幀的解析度設置為1280*720,以RBGA格式存儲,那麼每一幀的數據是1280*720*4=3686400Byte,約3.5MB,每秒24幀以上的幀率,這個是不小的數據量。總的來說,在性能優化上,我們遇到的主要挑戰如下:

挑戰1,數據從原生傳輸到js,在從js傳遞到原生,如此大的數據量將會成為js和原生通信的瓶頸;

挑戰2,在iOS平臺上,相機output只能指定BGRA格式,因為原始相機實時幀 CMSampleBufferRef對象內包含CVPixelBuffer對象,CoreVideo對象不支持RGBA格式,參考官方文檔
https://developer.apple.com/library/archive/qa/qa1501/_index.html

而WebGL標準的介面不支持BGRA格式,參考文檔:
https://developer.mozilla.org/en-US/docs/Web/API/WebGLRenderingContext/texImage2D,數據格式的轉換會加重性能的負擔;

挑戰3,即便以24幀為標準,每一幀的處理時間大約只有41ms,需要經歷原生相機生產、數據格式轉換、數據雙向傳輸、ar演算法、webgl繪製等流程,每一環節都很重,我們需要考慮如何利用併發調度優勢,並且保證實時幀的時序不會發生錯亂,因為時序一旦亂了,影像雖然一直在輸出,但是視覺感受是混亂的。

針對上述挑戰,進行了一系列的優化,最終在中低端手機(iPhone8 Plus)上達到平均26~27幀的幀率,整體體驗較為流暢,具體調優下麵詳細介紹。

性能調優

1、數據傳輸優化

原生和js之間傳輸大量的數據會成為性能的瓶頸,數據傳輸優化就是減少數據傳輸頻次,最好是數據保留一份,只傳遞數據的標記。

我們設計了一個NativeBuffer緩存來優化這個問題。主要流程如下

但是在js環境中,最終還是要使用js對象,原生相機實時幀的數據需要被轉換為js對象。那麼如何做才能讓數據只保留一份呢?

NO COPY

iOS端選擇運行小程式的js框架是JavaScriptCore,JavaScriptCore提供了一些C語言的介面方法,可以以NO COPY的方式,把一個void類型的二進位數據指針作為backing store,創建相對應的js對象,一般類型是ArrayBuffer或者TypeArray。也就是說原生和js對象背後的數據是同一份,共用這部分記憶體。

這樣一來我們只需要保證緩存的原始相機實時幀的數據不釋放,那麼js對象引用的這部分數據就會一直有效。那這部分數據要在什麼時候去清理呢?

銷毀

在創建js對象的時候,可以指定一個C的函數指針作為入參。當JavaScriptCore檢測到這個js對象銷毀的時候,會自動觸發該C函數的調用。我們需要按照指定的函數原型實現一個C的方法,在這個函數里去做緩存的清理,可以看一下這個函數的原型:

typedef void (*JSTypedArrayBytesDeallocator)(void* bytes, void* deallocatorContext);


該函數有2個參數,第一個bytes是原始相機實時幀的二進位數據,第二個是上下文環境,這裡我們傳的是NativeBuffer管理類的實例,在這個函數的具體實現中,我們去匹配NativeBuffer管理的緩存地址,找到相關數據進行清理。

寫入優化

前面我們說過,數據流轉是雙向的。原生把相機的數據傳輸到js側,js調用ARVR的人臉檢測介面,還需要把這份數據在傳輸到原生。因為相機和人臉檢測是相互獨立的介面,js拿到相機數據不一定非要調用人臉檢測,調用人臉檢測的數據也不一定非要來自於相機,還可以是一個本地的圖片。

相對應的,我們在NativeBuffer的設計中,提供數據雙向傳遞的介面,getNativeBuffer:id和setNativeBuffer:id。在原生傳遞到js的數據中,我們用了NO Copy的方式去做優化,那麼在js傳遞到原生的數據,由於我們不知道數據來源,所以需要開闢一份新的記憶體空間,調用memcpy複製數據。但是實際上,我們在做數據複製之前,可以用JavaScriptCore提供的介面,從js的ArrayBuffer對象中提取到真實數據的記憶體地址,然後在NativeBuffer緩存池中查找,如果找到了則無需再做數據複製。這樣保證了數據始終只有一份。

數據類型

在實踐的過程中,js端在選擇二進位對象的數據類型的時候,可能會用ArrayBuffer或者TypeArray。一旦js端進行了數據類型轉換,比如ArrayBuffer轉TypeArray,引擎在調用setNativeBuffer的時候,傳遞的是轉換後的數據類型,將會導致setNativeBuffer內部的寫入優化失效,進而在低端機上帶來明顯的卡頓。在這裡,我們統一使用一致的數據類型,不能隨意的轉換數據類型。

2、相機實時幀格式轉換

在技術挑戰中我們提到,iOS平臺上,相機output只能指定為BGRA格式,而WebGL標準的介面不支持該格式。如果不進行格式轉換,會導致紅藍顏色顛倒,紅色物體呈現藍色,藍色物體呈現紅色。所以在數據緩存和傳輸之前,要做格式轉換,我們需要找到一個快速低成本的方法。

要想做數據格式轉換,需要瞭解一些基本的圖像數據在記憶體中的佈局情況,如下圖所示。

這裡我們選取的BGRA和RGBA格式都是32位,也就是每一個像素點是4個位元組。

真實圖像數據由於記憶體對齊的原因,大小並不一定是width*height*4個位元組,CoreVideo框架提供了獲取相機數據寬高的方法,我們要計算出待處理的位元組大小,每4個位元組做一次迴圈,把第一位和第三位做一個調換,就能無需malloc記憶體,把BGRA轉換為RGBA格式。

3、併發調度

在技術挑戰中還提到,每一幀的處理時間大約只有41ms,需要經歷原生相機生產、數據格式轉換、數據雙向傳輸、ar演算法、webgl繪製等這麼多流程,如何利用併發優勢,並且保證實時幀的時序不會發生錯亂呢?

我們為了保證UI主線程的流暢,要儘可能把更多的環節放到子線程執行,這個時候哪怕寫入緩存這樣一個輕量的操作放到主線程都可能會帶來畫面的卡頓。

實時幀的處理、AR演算法分別放在不同的線程,為了保證實時幀時序,均採用串列隊列。

採用了多線程之後,NativeBuffer數據的存儲和清理需要加上線程安全保護。

這樣整體利用了多核的優勢,並保證了調用時序。線程調度和處理流轉如下圖所示:

4、資源管理

理想情況下,原生相機產生一個實時幀數據,JS消耗一個,在中高端機器上,性能能夠滿足需求,整體表現較為平穩,但是在低端機器中,線程搶占非常頻繁,當主線程和子線程發生線程搶占的時候,會導致供需不匹配,一旦實時幀數據消耗不及時,記憶體會產生爆炸式的增長,所以需要限定緩存池的容量,這個一般可以根據實際調試的情況指定一個數值即可。

還有一旦出現記憶體警告或者當緩存滿的時候,需要去清理緩存池,buffer如果正在被使用,就不能去清理,否則可能會出現白屏的現象,我們給buffer加了一個是否被消費的標記,當一個buffer被消費後,它不能以常規的方式清理,需要等待js消費完成之後清理,這個在上面也有介紹。

在頁面退出的時候,引擎需要監聽相關的事情,確保實時幀的監聽被停止,否則會出現多個js相機的監聽事件並存,一個數據被多次消費而引發異常。

結語

京東小程式致力於打造卓越的技術開放平臺,我們在提升性能、用戶體驗上不斷努力,我們也在建設和完善小程式的各種能力,歡迎大家提供寶貴的建議。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 環境: AlmaLinux release 9.1 MySQL Community Server Ver 8.0.33 Replication Manager v2.2.40 for MariaDB 10.x and MySQL 5.7 Series ProxySQL version 2.5.1-9 ...
  • 摘要:目前MetaERP已經覆蓋了華為公司100%的業務場景和80%的業務量。 本文分享自華為雲社區《強渡大渡河!華為雲GaussDB支撐華為MetaERP系統全面替換》,作者: 華為雲頭條。 近日,在“英雄強渡大渡河”MetaERP表彰會上,華為宣佈實現自主可控的MetaERP研發,並完成對舊ER ...
  • Redis集群是一種通過將多個Redis節點連接在一起以實現高可用性、數據分片和負載均衡的技術。它允許Redis在不同節點上同時提供服務,提高整體性能和可靠性。根據搭建的方式和集群的特性,Redis集群主要有三種模式:主從複製模式(Master-Slave)、哨兵模式(Sentinel)和Clust... ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: 王權富貴 文章來源:GreatSQL社區投稿 背景概述 由於安裝資料庫時將MySQL的數據目錄放在了根目錄下,現在存儲空間不足,想通過mv將數據 ...
  • 一、主從Redis部署(docker) 首先,我準備了兩台linux,一臺準備當作master,ip是192.168.241.128,另一臺是當作slave,ip是192.168.241.129。 1. 安裝redis docker pull redis 2. 下載對應版本的redis.conf 可 ...
  • 一、Redis Cluster 工作原理 在引入哨兵機制後,解決了Redis主從架構Master故障時的主從切換問題,保證了Redis服務可用性。但依舊無法解決單機節點出現的寫入性能瓶頸(網卡速率、單機記憶體容量、併發數量) 1、早期為解決單機性能瓶頸問題採用的解決方案: 1、客戶端分片:由客戶端程式 ...
  • 在App開發過程中,如果想實現動畫效果,可以粗略分為兩種方式。一種是直接用代碼編寫,像平移、旋轉等簡單的動畫效果,都可以這麼乾,如果稍微複雜點,就會對開發工程師的數學功底、圖形圖像學功底有很高的要求。 ...
  • Android Studio的安裝及環境配置 安裝jdk 下載及安裝Android Studio 下載官網:https://developer.android.google.cn/studio/ 往下滑: 建議下載到除C盤以外的盤: 下載好安裝程式之後 雙擊安裝:一路next,install And ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...