上一篇文字中講了利用Python實現(xiàn)利用微軟Azure無限免費將文本轉(zhuǎn)mp3格式的音頻文件并下載到本地。微軟Azure TTS的優(yōu)點不用多說,今天將講如何利用Python將其接入到虛擬主播中來。
訂閱專欄,我將免費向您提供具體的方案。
看過專欄其他文章的朋友,一定知道,我們使用的虛擬主播軟件為Motionface,其支持一些簡單好用的接口。我們先看看Motionface的效果:
我們看到了其要求是需要wav格式的音頻來驅(qū)動嘴型同步,但是微軟Azure語音合成為mp3格式,這時,我們需要將mp3音頻文件轉(zhuǎn)換成wav的音頻切采樣率為11025。
這個轉(zhuǎn)換過程是利用ffmeg,通過python腳本調(diào)用實現(xiàn)。
ffmpeg -i mp3\output_1649494987952.mp3 -f wav -ac 1 -ar 16000 ./output_1649494987952.wav
開始python代碼吧!文章來源:http://www.zghlxwxcb.cn/news/detail-614975.html
from ffmpy import FFmpeg as mpy
import os
def read_folder(mp3_folder, wav_folder):
'''
文件夾讀取函數(shù)
:param mp3_folder:
:param wav_folder:
:return:
'''
# 遍歷需要轉(zhuǎn)換的MP3文件夾中的MP3文件
for a in os.listdir(mp3_folder):
# 創(chuàng)建MP3文件的絕對路徑
mp3_file = os.path.join(mp3_folder, a)
# 調(diào)用格式轉(zhuǎn)換函數(shù)
trans_to_wav(mp3_file, wav_folder)
def trans_to_wav(mp3_file, wav_folder):
'''
格式轉(zhuǎn)換格式
:param mp3_file:
:param wav_folder:
:return:
'''
# 格式化文件
file_fmt = os.path.basename(mp3_file).strip()
# 獲取文件格式
file_fmt = file_fmt.split('.')[-1]
# 校驗文件格式
if file_fmt.strip() != 'mp3':
raise Exception('改文件不是MP3格式,請檢查!')
elif file_fmt.strip() == '':
raise Exception('文件格式出現(xiàn)異常,請檢查!')
# 創(chuàng)建wav的文件以供轉(zhuǎn)換完成后輸出
wav_file_path = os.path.join(wav_folder)
wav_file_path = os.path.join(wav_file_path, '{}.{}'.format(
os.path.basename(mp3_file).strip().split('.')[0], 'wav'
))
# 創(chuàng)建轉(zhuǎn)換時的命令行參數(shù)字符串
cmder = '-f wav -ac 1 -ar 11025'
# 創(chuàng)建轉(zhuǎn)換器對象
mpy_obj = mpy(executable='ffmpeg.exe',
inputs={
mp3_file: None
},
outputs={
wav_file_path: cmder
}
)
print('執(zhí)行CMDER 命令:{}'.format(mpy_obj.cmd))
mpy_obj.run()
if __name__ == '__main__':
'''
主函數(shù)入口
'''
# 輸入MP3文件夾
mp3_folder = input('輸入MP3文件夾路徑:\n')
# 校驗MP3文件夾是否存在
if mp3_folder.strip() == '':
raise Exception('輸入空值,請檢查!')
elif mp3_folder.strip() != '':
if os.path.exists(mp3_folder) is False:
raise Exception('文件路徑不存在')
# 輸入wav文件夾路徑
wav_folder = input('輸入wav文件夾路徑:\n')
# 校驗wav文件夾是否存在
if wav_folder.strip() == '':
raise Exception('輸入空值,請檢查!')
elif wav_folder.strip() != '':
if os.path.exists(wav_folder) is False:
raise Exception('文件路徑不存在')
# 調(diào)用文件夾讀取批量文件
read_folder(mp3_folder, wav_folder)
?接下來,我們將利用python,將wav音頻文件傳給motionface即可進行嘴型同步了:文章來源地址http://www.zghlxwxcb.cn/news/detail-614975.html
import sys
import threading
import urllib
import ssl
from urllib.parse import urlparse
from scripts import watcher, webdriver
from config.helper import config
import requests
def sendFile(filename, filepath):
url = "http://192.168.3.131:8080/cgi/savewav"
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'}
files = {'file': open(filepath, 'rb') }
files1 = {
'file':(filename,open(filepath, 'rb'), 'audio/wav')
}
data = {
'file':filename,
'objectName': filename,
'fileDownloadName': filename,
}
upload_res = requests.post(url,
data=data,
files=files1)
if __name__ == '__main__':
print('1')
sendFile('rec.wav','rec.wav')
到了這里,關(guān)于Python讓AI虛擬主播接入微軟Azure語音合成并精準嘴型同步的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!