HMS Core Discovery第16期回顧|與虎墩一起,玩轉AI新“聲”態

来源:https://www.cnblogs.com/hmscore/archive/2022/07/29/16531238.html
-Advertisement-
Play Games

HMS Core 在AI領域最新的技術能力有哪些?本期Discovery直播以《與虎墩一起,玩轉AI新“聲”態》為主題,邀請了HMS Core 機器學習服務產品經理、機器翻譯高級專家以及HMS Core的新朋友“虎墩”,為大家展示機器學習的語音語言創新技術,分享機器學習與人工智慧的巨集觀發展趨勢。一起 ...


HMS Core 在AI領域最新的技術能力有哪些?本期Discovery直播以《與虎墩一起,玩轉AI新“聲”態》為主題,邀請了HMS Core 機器學習服務產品經理、機器翻譯高級專家以及HMS Core的新朋友“虎墩”,為大家展示機器學習的語音語言創新技術,分享機器學習與人工智慧的巨集觀發展趨勢。一起回顧一下本期精彩內容!

【精彩回顧】

1、抖音網紅IP“虎墩小鏢師”強勢來襲

2、同聲傳譯新亮相,底層技術大揭秘

3、AI翻譯能力升級,語種擴充可播報

【專家觀點】


Nicolas,華為2012實驗室文本機器翻譯高級專家

機器翻譯暫時無法替代人類。目前需求不高的翻譯需求可以依賴機器但要求較高的翻譯需求還需要人工介入,人工可以做到點到面的全方位質量把控,比如說話地道與否、語言通順與否,還可以貢獻數據和知識,提升機器翻譯質量。


Hardy,HMS Core ML Kit 資深產品經理

AI是智能機器的廣義領域,而機器學習是AI的核心應用之一。它指的是任何能夠自行“學習”的電腦應用程式,而無需人類的明確規則。未來機器學習技術將會更註重情感體驗,向多模態(語音、文字、視覺)、多技術(VR/AR等)、多平臺多系統協同態勢的方向發展。

【精彩答疑】

Q1:什麼是TTS音色定製?TTS音色定製與虎墩在碰撞一起會有什麼新玩法?

A:依托華為的數據積累和成熟演算法,TTS音色定製在語音合成技術的加持下,只需要提供少量的乾凈錄音數據,就可以進行模型訓練,得到高還原度、高清晰度、高穩定性的專屬音庫,助於提升產品特色、快速打造個性化的品牌特色。ML Kit的新能力TTS與 IP“虎墩小鏢師”正在合作中,TTS通過機器訓練還原虎墩的音色,後續將逐步開放虎墩音色給開發者使用,助力開發者應用在各類個性化場景。

Q2:機器學習服務提供的翻譯和同聲傳譯能力,如何賦能App打造新“聲”態?

A:文本翻譯能力解決了用戶因語言不通而導致交流不暢的痛點。比如通話場景,經過實時語音識別,可以快速將識別的文字轉化為目標語言文字;閱讀場景,支持提詞翻譯器功能,幫助用戶快捷看到譯文;視頻類App集成文本翻譯服務後,用戶可以流暢體驗AI實時字幕功能。通過對語音識別、機器翻譯、語音合成三項技術的有機整合,同聲傳譯能力有較低時延、較高準確率的特性,適用於會議、直播、演講等實時性高的場景,支持應用將音頻內容實時輸出為目標語言文字,生成雙語字幕,同時對目標語言文本進行實時播報,降低理解成本,兼具質量與效率。

Q3:除以上語音語言類能力,機器學習服務有新推出其它創新能力嗎?

A:在金融電商領域,機器學習服務還提供了活體檢測能力動作活體檢測能力使用人臉關鍵點定位和人臉追蹤等技術,通過指令配合動作的形式可以驗證用戶是否為真實活體本人操作。在銀行、證券和借貸等實名制和安全性要求較高的金融領域,活體檢測可作為用戶遠程註冊和密碼找迴環節中的輔助驗證,幫助用戶甄別欺詐行為,有效抵禦攻擊行為,保障業務安全。

Q4:機器學習的巨集觀技術發展趨勢是怎樣的?

A:首先,機器學習會更加註重情感體驗。機器將具有識別、理解和表達喜怒哀樂的能力,識別用戶的需求以及環境信息的變化,理解人的情感意圖,做出適當反應;其次,是多模態的發展。深度學習技術正從語音、文字、視覺等單模態向學習多模態智能學習發展。未來甚至可以對嗅覺、味覺、心理學等難以量化的信號進行融合,實現多個模態的聯合分析,在更多場景、更多業務上輔助人類工作;再次,是多技術的融合,比如VR/AR以及元宇宙等。相信未來AI還將呈現多平臺多系統協同態勢,以實現更為廣泛的賦能,將通用平臺、行業平臺和端側應用的協同組合,以軟硬一體的方式實現具體應用的功能定製和擴展。

歡迎登錄HMS Core機器學習服務首頁瞭解更多技術細節。

瞭解更多詳情>>

訪問華為開發者聯盟官網
獲取開髮指導文檔
華為移動服務開源倉庫地址:GitHubGitee

關註我們,第一時間瞭解 HMS Core 最新技術資訊~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • SiteSucker for Mac是一款運行在Mac平臺上的整站下載工具,在SiteSucker Mac版中輸入網址就能離線下載一個網站里的所有內容,包括HTML、圖片、CSS 樣式表、JS 文件、Flash 文件等,SiteSucker for mac版的操作十分簡單,非常的實用。 詳情:Sit ...
  • 1.軟體下載 [root@localhost ~]# cd /usr/src/ [root@localhost src]# wget https://downloads.mysql.com/archives/get/p/23/file/mysql-5.7.38-linux-glibc2.12-x86 ...
  • 20 | 幻讀是什麼,幻讀有什麼問題? 建表和初始化語句如下 CREATE TABLE `t` ( `id` int(11) NOT NULL, `c` int(11) DEFAULT NULL, `d` int(11) DEFAULT NULL, PRIMARY KEY (`id`), KEY ` ...
  • 業務端需要求連續90日每日的用戶留存率改怎麼計算呢??? 一: 本文采用MySQL8.0環境 1: 建表數據 CREATE TABLE `user_login` ( `user_id` int NOT NULL, `login_date` varchar(20) CHARACTER SET utf8 ...
  • 我們已經介紹瞭如何在 Kubernetes 和 KubeSphere 上部署 RadonDB MySQL 集群。本文將演示如何在 Rancher[1] 上部署 RadonDB MySQL Kubernetes 2.2.0[2],快速獲得一套 MySQL 容器化集群。 部署準備 已部署 Rancher ...
  • --創建用戶① --GRANT(授權)REVOKE(回收許可權)--創建用戶create user 用戶名 identified by 密碼 GRANT CONNECT,RESOURCE TO 用戶;GRANT CREATE VIEW TO 用戶;GRANT CREATE SYNONYM TO 用戶; ...
  • 編程思想: 面向過程:問題比較簡單,可以用線性的思維解決 面向對象:問題較為複雜,使用簡單的線性思維無法解決 兩種編程思想都是解決問題的方式,並不對立,通過面向對象的方式便於我們從巨集觀上把握事物之間的複雜關係、便於我們分析整個系統。本質仍然使用面向過程的方式來處理。 面向對象的程式設計強調把數據和操 ...
  • 從單聲道、立體聲、環繞聲發展到三維聲,音頻回放技術的迭代演進是為了還原真實世界的聲音。其中,三維聲技術使用信號處理的方法對到達兩耳的聲音信號進行模擬,將聲場還原為三維空間,更接近真實世界。憑藉這個技術,各廠商在游戲、影視、音樂等場景中為用戶創造更真實自然且沉浸的聽覺體驗,也實現了更好的用戶訂閱增長。 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...