該文章為博主原創,如若轉載請註明出處:https://www.cnblogs.com/fengleixue/p/9482202.html 因公司業務需要需使用kaldi語音識別工具,現將kaldi環境配置等步驟列出來,用於記錄: 1.安裝虛擬機: 下載虛擬機VMware,並安裝,虛擬機安裝比較簡單, ...
該文章為博主原創,如若轉載請註明出處:https://www.cnblogs.com/fengleixue/p/9482202.html
因公司業務需要需使用kaldi語音識別工具,現將kaldi環境配置等步驟列出來,用於記錄:
1.安裝虛擬機:
下載虛擬機VMware,並安裝,虛擬機安裝比較簡單,可自行百度進行安裝,在此不再重覆。
2.Ubuntu操作系統安裝:
下載Ubuntu鏡像文件,本人選擇的事Ubuntu16.04版本。
3.虛擬機安裝Ubuntu系統,該步驟會進行詳細說明,如下:
3.1 VMware安裝完成之後選擇創建新虛擬機
3.2 選擇下載好的鏡像文件
3.3選擇下一步,設置系統名稱及密碼
3.4 繼續點擊下一步 設置系統安裝位置,這裡選擇自己比較大的一個盤即可
3.5 繼續下一步 選擇磁碟容量,此處建議稍微選大一些,否則之後kaldi跑數據會出現容量不足的錯誤
3.6 下一步,選擇自定義硬體設置 建議將記憶體和處理器進行調整,本人電腦記憶體8G此處設置6G,
因kaldi數據集一般都比較大,運行時比較耗費記憶體,此處調大,處理器個數根據自己電腦的配置
進行相應調整
3.7 返回上一頁,點擊完成。等待VMware自動安裝Ubuntu系統
4.ubuntu下安裝kaldi
4.1 打開unbuntu終端使用Ctrl+Alt+T快捷鍵可直接打開,輸入
git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden
即從github上下載kaldi最新版本,因kaldi在github上是持續更新維護,所以該路徑下的kaldi
版本比較完整,需要的例子及運行例子的源碼什麼的都有,
如果ubuntu沒有安裝git使用一下命令安裝即可:
sudo apt-get install git
4.2 下載完成之後進行解壓縮,找到kaldi的壓縮包直接右鍵提取。
4.3 目錄介紹:tools目錄全是kaldi依賴的包,egs為kaldi提供的實例,其中包含常用的數據集運行的
源碼,src目錄為kaldi 的源代碼
4.4 kaldi編譯
4.4.1 編譯之前確保全裝了一下組件:
apt-get,subversion,automake,autoconf,libtool,zlib,wget,libatal
使用如下命令安裝即可:
sudo apt-get install <組件名稱>
4.4.2 進入tools目錄下進行編譯
cd kaldi/tools 進入到kaldi/tools目錄
make或make -j 4(多核並行) 下載編譯
該過程比較慢,第一次進行make時會下載安裝一些組件。
4.4.3 進入src目錄進行配置並編譯
cd ../src 切換到kaldi/src目錄下
./configure kaldi運行前配置
make kaldi編譯
make過程中比較好費時間,當日誌最後顯示為
echo Done
Done
就成功了。
期間可能會遇到各種報錯信息,報錯時或是缺少組件或是組件不完整,如果提示缺少組件
安裝相應的組件即可,若發現安裝了之後還是報錯可能原因是組件內容下載不全,重新
下載即可。