20.5 語音合成(百度2016年2月29日發佈的tts引擎)

来源:http://www.cnblogs.com/rainmj/archive/2016/03/17/5285967.html
-Advertisement-
Play Games

分類:C#、Android、VS2015; 創建日期:2016-03-17 一、簡介 編寫手機App時,有時需要使用文字轉語音(Text to Speech)的功能,比如開車時閱讀收到的簡訊、導航語音提示、界面中比較重要的信息通過語音強調、……等。 由於Android自帶的Pico TTS並不支持中...


分類:C#、Android、VS2015;

創建日期:2016-03-17

一、簡介

編寫手機App時,有時需要使用文字轉語音(Text to Speech)的功能,比如開車時閱讀收到的簡訊、導航語音提示、界面中比較重要的信息通過語音強調、……等。

由於Android自帶的Pico TTS並不支持中文,所以要既能閱讀中文文本,還能閱讀英文文本,必須下載第三方提供的能說中文的語音包。

二、申請百度tts授權

本節以百度2016年2月29日發佈的“離線上融合語音合成SDK_Android 2.2.3版”為例說明用C#實現語音合成的基本用法。之所以選擇百度語音合成來實現,是因為據百度官網聲明,該開發包是“永久免費”的。網址如下:

http://yuyin.baidu.com/tts/

由於原來已經申請過MyDemos的授權,所以再繼續申請tts授權就比較簡單了,申請和設置步驟如下。

1、申請授權

進入 http://yuyin.baidu.com/tts/ 的首頁:

image

單擊【立即使用】,進入“開通語音合成服務”的頁面:

image

在下拉框中選擇原來已經申請的某個應用,單擊【下一步】,然後按提示操作,開通離線服務即可。

2、在BdMapV371BindingLib項目中轉換JAR文件

先通過 http://yuyin.baidu.com/tts/ 首頁中的【相關下載】下載對應的開發包,然後再按下麵的步驟操作。

1、將示例中的com.baidu.tts_2.2.3.20160229_359d952_release.jar、galaxy-v2.0.jar添加到Jars文件夾下,如下圖所示,然後將其【生成操作】屬性全部設置為“EmbeddedJar”。

image

2、在Metadata.xml文件中添加下麵的語句:

<remove-node path="/api/package[@name='com.baidu.tts.aop']/interface[@name='IProxyFactory']/method[@name='createProxied' and count(parameter)=0]" />

3、重新生成項目,此時應該無錯誤。

經過這3個步驟,就完成了tts的Jar包導入和轉換為.cs文件的過程。

3、在MyDemos項目中添加.so文件

將tts相關的4個.so文件添加到MyDemos項目的x86文件夾下,如下圖所示,然後將其【生成操作】屬性全部設置為“AndroidNativeLibrary”。

image

4、將.dat文件添加到sd卡的BaiduTTS文件夾下

具體添加辦法見【常見問題解答】,這裡不再截圖。

也可以先將這些文件添加到Assets文件夾下,然後通過代碼將其複製到sd卡的文件夾下。為簡化起見,這裡通過手工直接複製了。

OK,經過上面這4步,以後就可以在MyDemos項目中的任何模塊中輕鬆利用百度tts實現語音閱讀的功能了

三、示例

1、運行截圖

單擊【閱讀】,就會自動用女音朗讀文本框中的內容,單擊【批量閱讀】,就會依次朗讀隊列中添加的文欄位(主要是為了演示閱讀各種不同的中英文短句)。

image

2、設計步驟

(1)添加ch2005Main.axml

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    android:orientation="vertical">
    <LinearLayout
        android:layout_width="fill_parent"
        android:layout_height="50dp"
        android:orientation="horizontal"
        android:weightSum="4">
        <Button
            android:id="@+id/speak"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:text="閱讀"
            android:textSize="12dp" />
        <Button
            android:id="@+id/pause"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:text="暫停"
            android:textSize="12dp" />
        <Button
            android:id="@+id/resume"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:text="繼續"
            android:textSize="12dp" />
        <Button
            android:id="@+id/stop"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:text="停止"
            android:textSize="12dp" />
    </LinearLayout>
    <LinearLayout
        android:layout_width="fill_parent"
        android:layout_height="50dp"
        android:orientation="horizontal"
        android:weightSum="4">
        <Button
            android:id="@+id/synthesize"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:text="synthesize"
            android:textSize="12dp" />
        <Button
            android:id="@+id/play"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:text="play"
            android:textSize="12dp" />
        <Button
            android:id="@+id/batchSpeak"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:text="批量閱讀"
            android:textSize="12dp" />
        <Button
            android:id="@+id/nextActivity"
            android:layout_width="fill_parent"
            android:layout_height="fill_parent"
            android:layout_weight="1"
            android:lines="2"
            android:enabled="false"
            android:text="備用"
            android:textSize="12dp" />
    </LinearLayout>
    <EditText
        android:id="@+id/input"
        android:layout_width="fill_parent"
        android:layout_height="wrap_content"
        android:hint="input" />
    <TextView
        android:id="@+id/showText"
        android:layout_width="fill_parent"
        android:layout_height="fill_parent"
        android:layout_margin="10dp"
        android:background="@android:color/darker_gray"
        android:minLines="3"
        android:scrollbars="vertical" />
</LinearLayout>

2、添加ch2005MainActivity.cs

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

using Android.App;
using Android.OS;
using Android.Widget;
using Com.Baidu.Tts.Client;
using Com.Baidu.Tts.Answer.Auth;

namespace MyDemos.SrcDemos
{
    [Activity(Label = "【例20-5】百度tts基本用法")]
    public class ch2005MainActivity : Activity, ISpeechSynthesizerListener
    {
        private EditText mInput;
        private TextView mShowText;

        private SpeechSynthesizer mSpeechSynthesizer;

        /// <summary>
        /// sd卡上保存百度tts文件的路徑
        /// </summary>
        private string mSampleDirPath;

        private const string SpeechFemaleModelName = "bd_etts_speech_female.dat";
        private const string SpeechMaleModelName = "bd_etts_speech_male.dat";
        private const string TextModelName = "bd_etts_text.dat";
        private const string EnglishSpeechFemaleModelName = "bd_etts_speech_female_en.dat";
        private const string EnglishSpeechMaleModelName = "bd_etts_speech_male_en.dat";
        private const string EnglishTextModelName = "bd_etts_text_en.dat";

        protected override void OnCreate(Bundle savedInstanceState)
        {
            base.OnCreate(savedInstanceState);

            SetContentView(Resource.Layout.ch2005Main);
            mSampleDirPath = Android.OS.Environment.ExternalStorageDirectory.Path + "/baiduTTS";
            Console.WriteLine("mSampleDirPath=" + mSampleDirPath);
            initialView();
            initialTts();
        }

        private void initialTts()
        {
            mSpeechSynthesizer = SpeechSynthesizer.Instance;
            mSpeechSynthesizer.SetContext(this);
            mSpeechSynthesizer.SetSpeechSynthesizerListener(this);
            // 文本模型文件路徑 (離線引擎使用)
            mSpeechSynthesizer.SetParam(SpeechSynthesizer.ParamTtsTextModelFile,
                mSampleDirPath + "/" + TextModelName);
            // 聲學模型文件路徑 (離線引擎使用)
            mSpeechSynthesizer.SetParam(SpeechSynthesizer.ParamTtsSpeechModelFile,
                mSampleDirPath + "/" + SpeechFemaleModelName);

            // 請替換為語音開發者平臺上註冊應用得到的App ID (離線授權)
            //mSpeechSynthesizer.SetAppId("your_app_id");
            mSpeechSynthesizer.SetAppId(ch.TtsAppID);

            // 請替換為語音開發者平臺註冊應用得到的apikey和secretkey (線上授權)
            //this.mSpeechSynthesizer.SetApiKey("your_api_key", "your_secret_key");
            this.mSpeechSynthesizer.SetApiKey(ch.TtsApiKey, ch.TtsSecretKey);

            // 發音人(線上引擎),可用參數為0,1,2,3。。。(伺服器端會動態增加,各值含義參考文檔,以文檔說明為準。0--普通女聲,1--普通男聲,2--特別男聲,3--情感男聲。。。)
            mSpeechSynthesizer.SetParam(SpeechSynthesizer.ParamSpeaker, "0");
            // 設置Mix模式的合成策略
            mSpeechSynthesizer.SetParam(SpeechSynthesizer.ParamMixMode, SpeechSynthesizer.MixModeDefault);

            // 授權檢測介面(可以不使用,只是驗證授權是否成功)
            AuthInfo authInfo = this.mSpeechSynthesizer.Auth(TtsMode.Mix);
            if (authInfo.IsSuccess)
            {
                Console.WriteLine("授權檢測--授權成功(auth success)。");
            }
            else
            {
                string errorMsg = authInfo.TtsError.DetailMessage;
                Console.WriteLine("授權檢測--授權失敗(auth failed),errorMsg=" + errorMsg);
            }

            // 初始化tts
            mSpeechSynthesizer.InitTts(TtsMode.Mix);
            // 載入離線英文資源(提供離線英文合成功能)
            int result = mSpeechSynthesizer.LoadEnglishModel(
                mSampleDirPath +
                "/" + EnglishTextModelName, mSampleDirPath +
                "/" + EnglishSpeechFemaleModelName);
        }

        private void initialView()
        {
            mInput = FindViewById<EditText>(Resource.Id.input);
            mInput.Text = "今天陽光明媚,風和日麗!";

            mShowText = FindViewById<TextView>(Resource.Id.showText);

            var speak = FindViewById<Button>(Resource.Id.speak);
            speak.Click += delegate
            {
                string text = this.mInput.Text;
                int result = this.mSpeechSynthesizer.Speak(text);
                if (result < 0)
                {
                    System.Diagnostics.Debug.WriteLine("出錯了,錯誤碼:{0},請檢查百度tts文檔中對應錯誤碼的含義。", result);
                }
            };

            var pause = FindViewById<Button>(Resource.Id.pause);
            pause.Click += delegate
            {
                mSpeechSynthesizer.Pause();
            };

            var resume = FindViewById<Button>(Resource.Id.resume);
            resume.Click += delegate
            {
                mSpeechSynthesizer.Resume();
            };

            var stop = FindViewById<Button>(Resource.Id.stop);
            stop.Click += delegate
            {
                mSpeechSynthesizer.Stop();
            };

            var synthesize = FindViewById<Button>(Resource.Id.synthesize);
            synthesize.Click += delegate
            {
                string text = this.mInput.Text;
                int result = this.mSpeechSynthesizer.Synthesize(text);
                if (result < 0)
                {
                    System.Diagnostics.Debug.WriteLine("error,please look up error code in doc or URL:http://yuyin.baidu.com/docs/tts/122 ");
                }
            };

            var play = FindViewById<Button>(Resource.Id.play);
            play.Click += delegate { };

            var batchSpeak = FindViewById<Button>(Resource.Id.batchSpeak);
            batchSpeak.Click += delegate
            {
                List<SpeechSynthesizeBag> bags = new List<SpeechSynthesizeBag>();
                bags.Add(GetSpeechSynthesizeBag("123456", "0"));
                bags.Add(GetSpeechSynthesizeBag("你好", "1"));
                bags.Add(GetSpeechSynthesizeBag("使用百度語音合成SDK", "2"));
                bags.Add(GetSpeechSynthesizeBag("hello", "3"));
                bags.Add(GetSpeechSynthesizeBag("這是一個demo工程", "4"));
                int result = this.mSpeechSynthesizer.BatchSpeak(bags);
                if (result < 0)
                {
                    System.Diagnostics.Debug.WriteLine("error({0}),please look up error code in doc or URL:http://yuyin.baidu.com/docs/tts/122 ", result);
                }
            };
        }

        protected override void OnDestroy()
        {
            base.OnDestroy();
        }

        private SpeechSynthesizeBag GetSpeechSynthesizeBag(string text, string utteranceId)
        {
            SpeechSynthesizeBag speechSynthesizeBag = new SpeechSynthesizeBag();
            speechSynthesizeBag.SetText(text);
            speechSynthesizeBag.UtteranceId = utteranceId;
            return speechSynthesizeBag;
        }

        public void OnError(string utteranceId, SpeechError error)
        {
            Console.WriteLine("onError error=" + error.Description + "--utteranceId=" + utteranceId);
        }

        public void OnSpeechFinish(string utteranceId)
        {
            Console.WriteLine("onSpeechFinish utteranceId=" + utteranceId);
        }

        public void OnSpeechProgressChanged(string p0, int p1)
        {
            //Console.WriteLine("onSpeechProgressChanged");
        }

        public void OnSpeechStart(string utteranceId)
        {
            Console.WriteLine("onSpeechStart utteranceId=" + utteranceId);
        }

        public void OnSynthesizeDataArrived(string utteranceId, byte[] data, int progress)
        {
            Console.WriteLine("onSynthesizeDataArrived");
        }

        public void OnSynthesizeFinish(string utteranceId)
        {
            Console.WriteLine("onSpeechFinish utteranceId=" + utteranceId);
        }

        public void OnSynthesizeStart(string utteranceId)
        {
            Console.WriteLine("onSynthesizeStart utteranceId=" + utteranceId);
        }
    }
}

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前段時間,同事又來咨詢一個問題了,說手機端動不動拍照就好幾M高清大圖,上傳伺服器太慢,問問我有沒有可以壓縮圖片並上傳的js插件,當然
  • 這是一個12306火車票訂票項目源碼,火車票訂票 所有功能均已實現,我們都知道12306是一個偉大的項目,但是在APP方面做得還是不怎麼樣,不過這個項目只是一個參考吧。 源碼下載:http://code.662p.com/view/12876.html 詳細說明:http://android.662
  • 這是一個不錯的Android美女的秘密項目。 源碼下載:http://code.662p.com/list/11_1.html<ignore_js_op> 詳細說明:http://android.662p.com/thread-6463-1-1.html
  • Realm 是一個跨平臺的移動資料庫引擎,於 2014 年 7 月發佈,準確來說,它是專門為移動應用所設計的數據持久化解決方案之一。 Realm 可以輕鬆地移植到您的項目當中,並且絕大部分常用的功能(比如說插入、查詢等等)都可以用一行簡單的代碼輕鬆完成! Realm 並不是對 Core Data 的
  • 本人畢業設計作品,現在整理了下拿出來共用,內部請求皆為charles抓包獲取,所以有部分請求失敗屬於正常現象。 源碼下載:http://code.662p.com/view/13186.html<ignore_js_op> <ignore_js_op> <ignore_js_op> 詳細說明:htt
  • Reveal下載地址:http://revealapp.com/ ,目前要收費了,而且還不便宜,好東西都這樣嘛~ 針對越獄設備和非越獄設備可以採取不同的方法,一種是在工程項目中加入Reveal.framework,和一般應用第三方framework差不多,這種先不詳述。第二種針對越獄設備。 先發一張
  • 高仿美團框架基本已搭好。代碼簡單易懂,適合新人。適合新人。 源碼下載:http://code.662p.com/list/12_1.html新人。 <ignore_js_op> <ignore_js_op> 詳細說明:http://ios.662p.com/thread-2774-1-1.html
  • 代碼:
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...