使用SpeechRecognition進行語音識別

-Advertisement-

操作系統： CentOS7.7.1908_x64 gcc版本：4.8.5 Python 版本 : 3.6.8 安裝語音識別環境： virtualenv -p /usr/bin/python3 py36asr source py36asr/bin/activate pip install Spee ...

操作系統： CentOS7.7.1908_x64

gcc版本：4.8.5

Python 版本 : 3.6.8

安裝語音識別環境：

virtualenv -p /usr/bin/python3 py36asr
source py36asr/bin/activate
pip install SpeechRecognition
yum install python3-devel
yum install pulseaudio-libs-devel
yum install alsa-lib-devel
pip install  PocketSphinx

配置中文語音識別數據：

下載地址：

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/

選擇： Mandarin->cmusphinx-zh-cn-5.2.tar.gz

配置數據：

cd py36asr/lib/python3.6/site-packages/speech_recognition/pocketsphinx-data/
tar zxvf cmusphinx-zh-cn-5.2.tar.gz
mv cmusphinx-zh-cn-5.2 zh-cn
cd zh-cn
mv zh_cn.cd_cont_5000 acoustic-model
mv zh_cn.lm.bin language-model.lm.bin
mv zh_cn.dic pronounciation-dictionary.dict

測試文本：

自然語言理解和生成是一個多方面問題，我們對它可能也只是部分理解。

語音識別示例：

(py36asr) [root@host60 pyasrTest1]# ls
test1.py  test1.wav
(py36asr) [root@host60 pyasrTest1]# cat test1.py
# -*- coding: utf-8 -*-
# /usr/bin/python

import speech_recognition as sr
r = sr.Recognizer()
test = sr.AudioFile("test1.wav")
with test as source:
    audio = r.record(source)
type(audio)
c=r.recognize_sphinx(audio, language='zh-cn')
print(c)
(py36asr) [root@host60 pyasrTest1]# python test1.py
自然 語言 李傑 和 申城 是一 個 多方 面 問題 我們 對 他 可能 也 只是 部分 禮節
(py36asr) [root@host60 pyasrTest1]#

本文涉及資源下載地址：https://pan.baidu.com/s/1Out0tJlb_Qs-2C06_2YHOQ

可關註微信公眾號（聊聊博文）後回覆 2020062101 獲取提取碼。

本文github地址：

https://github.com/mike-zhang/mikeBlogEssays/blob/master/2020/20200621_使用SpeechRecognition進行語音識別.rst

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

CSS：定位（靜態、相對、絕對、固定、粘性）

1、定位（1）定位將盒子定在某一個位置，所以定位也是在擺放盒子，按照定位的方式移動盒子（2）定位的作用某一個元素可以自由的在一個盒子內部移動，並且壓住其他盒子（使用標準流或者浮動很難實現）定位可以讓元素固定屏幕中的某個位置，並且可以壓住其他盒子（3）定位的組成定位=定位模式+邊偏移定 ...
屏幕解析度基礎概念PX，PT，DP，DPR，DPI說明

屏幕解析度基礎概念說明縮寫全稱說明 PX Device Pixels 設備像素，指設備的物理像素 PX CSS Pixels CSS像素，指CSS樣式代碼中使用的邏輯像素 DOT Dot 點，屏幕或列印紙上的點，等同物理像素 PT Point 點（傳統長度單位）為1/72英寸=0.35mm P ...
Web前端相容性指南

一直以來，Web前端領域最大的問題就是相容性問題，沒有之一。前端相容性問題分三類：瀏覽器相容性問題、屏幕解析度相容性問題、跨平臺相容性問題 Web前端框架也分三類：瀏覽器相容框架、響應式框架、跨平臺框架 ...
vue-admin-template搭建後臺管理系統的學習（一）

首先我們來看看這個基礎模版的目錄結構 ├── build // 構建相關 ├── config // 配置相關├── src // 源代碼│ ├── api // 所有請求│ ├── assets // 主題字體等靜態資源│ ├── components // 全局公用組件│ ├── direct ...
三年Git使用心得 & 常見問題整理，80%的人都不懂

Git 流程圖 Workspace：工作區 Index / Stage：暫存區 Repository：倉庫區（或本地倉庫） Remote：遠程倉庫配置 Git：另外技術是不斷更新的。在此贈送2020最新企業級別Vue3.0/Js/ES6/TS/React/node等實戰視頻教程，想學的可進裙 51 ...
30張腦圖帶你從零開始學VUE，值得收藏

"不畏懼，不講究，未來的日子好好努力"——大家好！我是小芝麻😄 首先感謝大家對小芝麻上一篇《想自學JS嗎？想提升JS底層原理嗎？76張腦圖帶你徹底搞懂原生JS》的支持和認可🙏，，其次是感謝大家的包容和鼓勵；特別、特別、特別感謝！！！另外筆者也成功升到了3級😄 ；既然大家都沒什麼要求，那本芝 ...
C連載9-char類型詳解

一、char類型 1.char類型存儲的是整數而不是字元，例如：在ASCII中，65代表A； 2.標準ASCII範圍為0-127；商用統一編碼Unicode創建一個全球字元合集； 3.註意點：C語言把1位元組定義為char類型占用的位數，因此在16位，32位，64位系統中都是可以用char類型的。有 ...
Java筆記：多線程

1. Java線程理解進程：進程就相當於一個應用程式，而線程是進程中的執行場景或者說執行單元，一個進程可以啟動多個線程。線程併發：對於電腦的CPU，例如4核的CPU，表示在同一個時間點上，可以真正做到有4個進程併發執行。而對於單核CPU，是不能做到真正的多線程併發的，只是由於CPU線上程之間切換 ...