進群:125240963 即可獲取數十套PDF哦! 進群:125240963 即可獲取數十套PDF哦! 前面幾天想看一個電影(至於什麼電影就不說了),搜了半天沒有中文字幕。 看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字 這麼貴! 好在這難道不了一個吃苦耐勞的程式員,在知乎某位大 ...
前面幾天想看一個電影(至於什麼電影就不說了),搜了半天沒有中文字幕。
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
這麼貴!
好在這難道不了一個吃苦耐勞的程式員,在知乎某位大佬哪裡找到了這個東西 !
點擊現有服務,找到已有的服務。
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
點擊服務名稱查看詳情。
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
看到頁面下方顯示服務憑證,且username和password都是加密符號表示。
點擊右側的「顯示」,打開眼睛,
把username和password記下來
(複製到記事本里啦不要翻小本本了!)
好了,任務完成,我們可以把官網關掉了。
第三步:
安裝SpeechRecognition包
打開cmd,輸入pip install SpeechRecognition,耐心等待一會就安裝成功了。
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
出現這個就安裝成功了!
第四步:
打開Jupyter Notebook開始擼代碼!
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
運行這一步發現報錯了
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
原來要wav格式。
給大家推薦一個好用的神器:格式工廠。
音頻視頻文件轉格式我都用它,方便小巧。
轉格式後把引號里的內容改成1.wav就可以運行了。接著定義賬號密碼,
把引號里的XXX改成你自己的
IBM_USERNAME = 'XXXXXXXX'
IBM_PASSWORD= 'XXXXXXXX'
以及調用IBM的Speech to text。
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
我這2分多鐘的音頻大概運行了半分鐘左右吧。
這個text,就是你音頻轉過來的文字了。
讓我們來試試:
print(text)
看日本電影再也不怕看不懂了,6行Python代碼輕鬆實現音頻轉文字
雖然準確率沒有100%,但是也很厲害了!
它還支持很多語言。只要把language變數改成以下這些語言就可以了
- ar-AR 阿根廷語
- en-UK 英式英語
- en-US 美式英語
- es-ES 西班牙語
- fr-FR 法語
- ja-JP 日語
- pt-BR 巴西葡萄牙語
- zh-CN 中文
溫馨提示:每個免費賬戶每個月都可使用100分鐘,30天不活躍服務將會被刪除
話不多說,我去看電影去了。
希望對你有幫助!