HMS Core 在AI領域最新的技術能力有哪些?本期Discovery直播以《與虎墩一起,玩轉AI新“聲”態》為主題,邀請了HMS Core 機器學習服務產品經理、機器翻譯高級專家以及HMS Core的新朋友“虎墩”,為大家展示機器學習的語音語言創新技術,分享機器學習與人工智慧的巨集觀發展趨勢。一起 ...
HMS Core 在AI領域最新的技術能力有哪些?本期Discovery直播以《與虎墩一起,玩轉AI新“聲”態》為主題,邀請了HMS Core 機器學習服務產品經理、機器翻譯高級專家以及HMS Core的新朋友“虎墩”,為大家展示機器學習的語音語言創新技術,分享機器學習與人工智慧的巨集觀發展趨勢。一起回顧一下本期精彩內容!
【精彩回顧】
1、抖音網紅IP“虎墩小鏢師”強勢來襲
2、同聲傳譯新亮相,底層技術大揭秘
3、AI翻譯能力升級,語種擴充可播報
【專家觀點】
Nicolas,華為2012實驗室文本機器翻譯高級專家
機器翻譯暫時無法替代人類。目前需求不高的翻譯需求可以依賴機器但要求較高的翻譯需求還需要人工介入,人工可以做到點到面的全方位質量把控,比如說話地道與否、語言通順與否,還可以貢獻數據和知識,提升機器翻譯質量。
Hardy,HMS Core ML Kit 資深產品經理
AI是智能機器的廣義領域,而機器學習是AI的核心應用之一。它指的是任何能夠自行“學習”的電腦應用程式,而無需人類的明確規則。未來機器學習技術將會更註重情感體驗,向多模態(語音、文字、視覺)、多技術(VR/AR等)、多平臺多系統協同態勢的方向發展。
【精彩答疑】
Q1:什麼是TTS音色定製?TTS音色定製與虎墩在碰撞一起會有什麼新玩法?
A:依托華為的數據積累和成熟演算法,TTS音色定製在語音合成技術的加持下,只需要提供少量的乾凈錄音數據,就可以進行模型訓練,得到高還原度、高清晰度、高穩定性的專屬音庫,助於提升產品特色、快速打造個性化的品牌特色。ML Kit的新能力TTS與 IP“虎墩小鏢師”正在合作中,TTS通過機器訓練還原虎墩的音色,後續將逐步開放虎墩音色給開發者使用,助力開發者應用在各類個性化場景。
Q2:機器學習服務提供的翻譯和同聲傳譯能力,如何賦能App打造新“聲”態?
A:文本翻譯能力解決了用戶因語言不通而導致交流不暢的痛點。比如通話場景,經過實時語音識別,可以快速將識別的文字轉化為目標語言文字;閱讀場景,支持提詞翻譯器功能,幫助用戶快捷看到譯文;視頻類App集成文本翻譯服務後,用戶可以流暢體驗AI實時字幕功能。通過對語音識別、機器翻譯、語音合成三項技術的有機整合,同聲傳譯能力有較低時延、較高準確率的特性,適用於會議、直播、演講等實時性高的場景,支持應用將音頻內容實時輸出為目標語言文字,生成雙語字幕,同時對目標語言文本進行實時播報,降低理解成本,兼具質量與效率。
Q3:除以上語音語言類能力,機器學習服務有新推出其它創新能力嗎?
A:在金融電商領域,機器學習服務還提供了活體檢測能力。動作活體檢測能力使用人臉關鍵點定位和人臉追蹤等技術,通過指令配合動作的形式可以驗證用戶是否為真實活體本人操作。在銀行、證券和借貸等實名制和安全性要求較高的金融領域,活體檢測可作為用戶遠程註冊和密碼找迴環節中的輔助驗證,幫助用戶甄別欺詐行為,有效抵禦攻擊行為,保障業務安全。
Q4:機器學習的巨集觀技術發展趨勢是怎樣的?
A:首先,機器學習會更加註重情感體驗。機器將具有識別、理解和表達喜怒哀樂的能力,識別用戶的需求以及環境信息的變化,理解人的情感意圖,做出適當反應;其次,是多模態的發展。深度學習技術正從語音、文字、視覺等單模態向學習多模態智能學習發展。未來甚至可以對嗅覺、味覺、心理學等難以量化的信號進行融合,實現多個模態的聯合分析,在更多場景、更多業務上輔助人類工作;再次,是多技術的融合,比如VR/AR以及元宇宙等。相信未來AI還將呈現多平臺多系統協同態勢,以實現更為廣泛的賦能,將通用平臺、行業平臺和端側應用的協同組合,以軟硬一體的方式實現具體應用的功能定製和擴展。
歡迎登錄HMS Core機器學習服務首頁瞭解更多技術細節。
瞭解更多詳情>>
訪問華為開發者聯盟官網
獲取開髮指導文檔
華為移動服務開源倉庫地址:GitHub、Gitee
關註我們,第一時間瞭解 HMS Core 最新技術資訊~