聲音識別和聲學模型的建立 [email protected] http://www.cnblogs.com/swje/ 作者:Zhouwan 2016-3-30 聲明 1)本文僅供學術交流,非商用。所以每一部分具體的參考資料並沒有詳細對應。如果某部分不小心侵犯了大家的利益,還望海涵,並聯繫博主 ...
聲音識別和聲學模型的建立
[email protected]
http://www.cnblogs.com/swje/
作者:Zhouwan
2016-3-30
聲明
1)本文僅供學術交流,非商用。所以每一部分具體的參考資料並沒有詳細對應。如果某部分不小心侵犯了大家的利益,還望海涵,並聯繫博主刪除。
2)本人才疏學淺,整理總結的時候難免出錯,還望各位前輩不吝指正,謝謝。
請聯繫:[email protected] 或[email protected]
本研究課題系本人本科畢業論文,具體學習計劃見http://www.cnblogs.com/swje/p/5068069.html,
後面會實時更新,希望能與大家相互交流,共同進步!學完char-rnn,開始著手思考其應用,最近學習了一點聲音識別(speech recognition)方面的資料。作為梳理和總結,發表此篇文章記錄一下。
參考代碼和學習網址:
特征提取(MFCC):
PLP and RASTA (and MFCC, and inversion) in Matlab
using melfcc.m and invmelfcc.m
Google論壇上關於Speech recognition on Torch7的討論 Audio Fingerprinting with Python and Numpy 語音特征參數MFCC計算的詳細過程 zouxy的博客:語音信號處理之(四)梅爾頻率倒譜繫數(MFCC)學習體會:
未完,待續……