前言
大家好,我是空空star,本篇給大家分享一下通過Python的speech_recognition庫將音頻文件轉為文字。
上一篇已經介紹了相關的庫speech_recognition
。
通過Python的speech_recognition庫將音頻文件轉為文字 |
---|
Python-語音轉文字相關庫介紹
一、音頻準備
這里我們通過gTTS先生成一段音頻,gTTS相關的介紹可以看博主之前寫的博客。
通過Python的gtts庫將文字轉為音頻
from gtts import gTTS
local = '/Users/kkstar/Downloads/video/'
text = '大家好,我是空空star,本篇給大家分享一下音頻轉文字,這是通過speech_recognition轉換的文字。'
language = "zh-cn"
tts = gTTS(text=text, lang=language)
tts.save(local+"audio_gtts_0509.mp3")
二、音頻聲音
音頻轉文字_0509
三、格式轉換
mp3轉為wav。
這里不能只改后綴,需要用音頻轉換工具轉換下。
audio_gtts_0509.mp3->audio_gtts_0509.wav
四、音頻轉文字
1.引入庫
import speech_recognition as sr
2.定義音頻路徑
local = '/Users/kkstar/Downloads/video/'
3.創(chuàng)建一個Recognizer對象
r = sr.Recognizer()
4.打開音頻文件,將音頻文件讀入Recognizer對象
音頻文件必須是wav的格式
# 打開音頻文件
with sr.AudioFile(local+'audio_gtts_0509.wav') as source:
# 將音頻文件讀入Recognizer對象
audio = r.record(source)
5.嘗試使用Google Web API將語音轉換為文字
try:
text = r.recognize_google(audio, language=‘zh-CN’)
print(‘轉換結果:’, text)
except sr.UnknownValueError:
print(‘無法識別語音’)
except sr.RequestError as e:
print(‘無法連接到Google Web API. {0}’.format(e))
6.轉換結果
轉換結果: 大家好我是空空Store本篇給大家分享一下音頻轉文字這是通過Keep下劃線recognition轉換的文字
Process finished with exit code 0文章來源:http://www.zghlxwxcb.cn/news/detail-439172.html
總結
recognize_google
: recognize_google() 是Google提供的一種語音識別API,可以識別音頻文件或麥克風錄制的語音,并將其轉換為文本。在Python中,可以使用SpeechRecognition庫中的recognize_google()方法來調用該API。文章來源地址http://www.zghlxwxcb.cn/news/detail-439172.html
到了這里,關于通過Python的speech_recognition庫將音頻文件轉為文字的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!