線上文本翻譯能力新增14個直譯模型,打造以中文為軸心語言的翻譯系統

来源:https://www.cnblogs.com/hmscore/archive/2023/02/28/17164393.html
-Advertisement-
Play Games

經濟全球化的今天,人們在工作和生活中經常會與外語打交道。相較傳播性較廣的英語而言,其他語種的識別和閱讀對大多數人來說是一件難事,此時就需要藉助語言翻譯軟體來幫助理解。 華為 HMS Core 機器學習服務(ML Kit)翻譯功能提供了多種翻譯模式,不僅可以滿足應用出行購物、網路社交等日常場景,還提供 ...


經濟全球化的今天,人們在工作和生活中經常會與外語打交道。相較傳播性較廣的英語而言,其他語種的識別和閱讀對大多數人來說是一件難事,此時就需要藉助語言翻譯軟體來幫助理解。

華為 HMS Core 機器學習服務(ML Kit)翻譯功能提供了多種翻譯模式,不僅可以滿足應用出行購物、網路社交等日常場景,還提供辦公文檔、視頻字幕等專業翻譯服務,滿足多種語言和場景應用。其中線上文本翻譯能力支持15國語種中文互譯,滿足郵件翻譯、語音翻譯、瀏覽器翻譯、同傳翻譯等場景。

當前主流的翻譯模式大都以語料資源較為豐富的英文作為中間語言進行“橋接”翻譯,但是經英文轉移後翻譯精度有所損失,且計算資源加倍執行效果降低。

基於此,HMS Core機器學習服務對線上文本翻譯能力進行升級,在原有的8國語言上又新增中意、中阿、中波、中荷、意中、阿中、波中、荷中 、中馬、中泰、中越、越中、泰中、馬中十四個直譯模型,支持TOP15語種中文互譯。相較於英文橋接翻譯,中文直譯模型可實現每秒併發300字元,端到端翻譯速度小於150ms,翻譯時延降低100%,翻譯速度更快;針對中文特色詞、俚語的翻譯結果更地道,翻譯質量更優。線上文本翻譯能力分批次打造可信中文直譯系統,確保中文和TOP語種的互譯效果優於友商,打造差異化競爭力,可以滿足中企出海或外企入華等對翻譯要求更高場景的需求。

產品優勢

個性化術語翻譯

用戶可自行提供術語以優化翻譯結果,華為術語翻譯引擎提供可定製的個性化術語翻譯能力。

中文為軸心的機器翻譯

支持TOP15語種中文互譯,讓翻譯時延更低,質量更優。在WMT 2021 國際機器翻譯大賽三角翻譯任務中,獲得俄到中翻譯第一名。

響應實時穩定

全流程毫秒級響應,譯文結果精準流暢。全球四大站點部署,助力品牌出海無憂。

多語言翻譯質量領先

依托先進的機器翻譯技術,結合各垂域大數據優勢,滿足用戶在多領域、多場景下的翻譯需求。在IWSLT 2020國際翻譯大賽中,獲得中到英字幕翻譯第一名。

開發步驟

開發準備

在進行開發之前,您需要完成必要的開發準備工作,同時請確保您的工程中已經配置HMS Core SDK的Maven倉地址,並且完成了本服務的SDK集成

線上文本翻譯能力集成

  1. 請參見雲端鑒權信息使用須知,設置您應用的鑒權信息。

  2. 創建線上文本翻譯器。可以通過文本翻譯器自定義參數類MLRemoteTranslateSetting創建翻譯器。

// 使用自定義的參數配置創建文本翻譯器。
MLRemoteTranslateSetting setting = new MLRemoteTranslateSetting
    .Factory()
    // 設置源語言的編碼,使用ISO 639-1標準(中文繁體使用BCP-47標準)。此設置為可選項,如果不設置,將自動檢測語種進行翻譯。
    .setSourceLangCode("zh")
    // 設置目標語言的編碼,使用ISO 639-1標準(中文繁體使用BCP-47標準)。
    .setTargetLangCode("en")
    .create();
MLRemoteTranslator mlRemoteTranslator = MLTranslatorFactory.getInstance().getRemoteTranslator(setting);
  1. 可通過下麵的方法查詢線上翻譯所支持的語種。

非同步方法示例代碼:

MLTranslateLanguage.getCloudAllLanguages().addOnSuccessListener(
    new OnSuccessListener<Set<String>>() {
        @Override
        public void onSuccess(Set<String> result) {
            // 成功獲取線上翻譯所支持的語種。
    }
});

同步方法示例代碼:

try {
    Set<String> result = MLTranslateLanguage.syncGetCloudAllLanguages();
    // 成功獲取線上翻譯所支持的語種。
} catch (MLException e) {
    // 獲取線上翻譯所支持的語種出現異常。
}
  1. 進行線上文本翻譯(錯誤碼信息可參見:機器學習服務錯誤碼)。

非同步方法示例代碼:

// sourceText是待翻譯的文本,長度需小於5000個字元。
final Task<String> task = mlRemoteTranslator.asyncTranslate(sourceText);
task.addOnSuccessListener(new OnSuccessListener<String>() {
    @Override
     public void onSuccess(String text) {
         // 識別成功的處理邏輯。
   }
}).addOnFailureListener(new OnFailureListener() {
     @Override
     public void onFailure(Exception e) {
         // 識別失敗的處理邏輯。
         try {
             MLException mlException = (MLException)e;
             // 獲取錯誤碼,開發者可以對錯誤碼進行處理,根據錯誤碼進行差異化的頁面提示。
             int errorCode = mlException.getErrCode();
             // 獲取報錯信息,開發者可以結合錯誤碼,快速定位問題。
             String errorMessage = mlException.getMessage();
         } catch (Exception error) {
           // 轉換錯誤處理。
         }
     }
 });

可選:同步方法示例代碼:

try {
    String output = mlRemoteTranslator.syncTranslate(sourceText);
    // 識別成功的處理邏輯。
} catch (MLException e) {
    // 識別失敗的處理邏輯。
    // 獲取錯誤碼,開發者可以對錯誤碼進行處理,根據錯誤碼進行差異化的頁面提示。
    int errorCode = e.getErrCode();
    // 獲取報錯信息,開發者可以結合錯誤碼,快速定位問題。
     String errorMessage = mlException.getMessage();
}
  1. 翻譯完成後,釋放資源。
if (mlRemoteTranslator!= null) {
    mlRemoteTranslator.stop();
}

瞭解更多詳情>>

訪問華為開發者聯盟官網
獲取開髮指導文檔
華為移動服務開源倉庫地址:GitHubGitee

關註我們,第一時間瞭解 HMS Core 最新技術資訊~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 該引擎繼承於MergeTree,併在數據塊合併演算法中添加了摺疊行的邏輯。CollapsingMergeTree會非同步的刪除(摺疊)這些除了特定列Sign有1和-1的值以外,其餘所有欄位的值都相等的成對的行。沒有成對的行會被保留。因此,該引擎可以顯著的降低存儲量並提高SELECT查詢效率。 簡單來說就 ...
  • 轉載於:(140條消息) 如何管理oralce口令文件和參數文件_oracle 口令文件_夢想家DBA匠人的博客-CSDN博客口令文件審核 Step 1: 使用root賬號將 oracle dba的許可權移除 [root@oracle-db-19c ~]# su - oracle[oracle@ora ...
  • 前言 Redis 提供了 2 個不同形式的持久化方式: RDB(Redis DataBase) AOF(Append Of File) RDB 在指定的時間間隔內將記憶體中的數據集快照寫入磁碟, 也就是行話講的 Snapshot 快照,它恢復時是將快照文件直接讀到記憶體里。 備份是如何執行的 Redis ...
  • 約束 約束是作用於表中欄位上的規則,用於限制存儲在表中的數據,保證資料庫中數據的正確、有效和完整。 一. 常用的約束 約束作用於表中的欄位,可以在創建表或修改表的時候添加約束。 AUTO_INCREMENT 約束關鍵字 自動增長:用於比如每次新添加一行數據,id就+1。 如果自增和主鍵一起使用時,插 ...
  • 連接查詢用於多表關聯查詢,連接方式不同,查詢重點不同。 內連接 作用:查詢多表之間交集部分數據 關鍵詞:inner join 可簡寫為:join,即 inner join = join 圖示: 左外連接 作用:表 A 左連接表 B,以左表 A 為主查詢,關聯查詢表 B,查詢左表 A 所有數據,以及表 ...
  • sqlite3資料庫是一個小型的資料庫,當數據量不大,要求不是特別高的時候,是個不錯的選擇。 在Linux上移植和使用也非常的方便。 本示例是在硬體全志r528 .linux5.4 上驗證的。 移植操作: 1、源碼下載 去官網進行下載源碼SQLite Download Page,根據自己的選取選擇不 ...
  • 摘要:GaussDB目前採用的FIFO調度機制,該調度機制無法滿足用戶的網路隔離需求和QoS需求,同時FIFO調度可能帶來比較嚴重的抖動。 本文分享自華為雲社區《【玩轉PB級數倉GaussDB(DWS)】GaussDB(DWS)網路調度與隔離管控能力》,作者:門前一棵葡萄樹 。 一、常見的調度演算法 ...
  • 最近工作中需要部署一套資料庫服務到內網伺服器上,藉此機會,我重新整理了postgresql資料庫的搭建及入門使用方法 1、安裝方式(兩種選一種) a、第一種方式 sudo yum install -y https://download.postgresql.org/pub/repos/yum/rep ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...