国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python讓AI虛擬主播接入微軟Azure語音合成并精準嘴型同步

這篇具有很好參考價值的文章主要介紹了Python讓AI虛擬主播接入微軟Azure語音合成并精準嘴型同步。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

上一篇文字中講了利用Python實現(xiàn)利用微軟Azure無限免費將文本轉(zhuǎn)mp3格式的音頻文件并下載到本地。微軟Azure TTS的優(yōu)點不用多說,今天將講如何利用Python將其接入到虛擬主播中來。

訂閱專欄,我將免費向您提供具體的方案。

看過專欄其他文章的朋友,一定知道,我們使用的虛擬主播軟件為Motionface,其支持一些簡單好用的接口。我們先看看Motionface的效果:

python生成虛擬主播,人工智能實用軟件源碼工具等分享,語音識別,人工智能,深度學習

我們看到了其要求是需要wav格式的音頻來驅(qū)動嘴型同步,但是微軟Azure語音合成為mp3格式,這時,我們需要將mp3音頻文件轉(zhuǎn)換成wav的音頻切采樣率為11025。

這個轉(zhuǎn)換過程是利用ffmeg,通過python腳本調(diào)用實現(xiàn)。

ffmpeg -i mp3\output_1649494987952.mp3 -f wav -ac 1 -ar 16000 ./output_1649494987952.wav

開始python代碼吧!

from ffmpy import FFmpeg as mpy
import os 

def read_folder(mp3_folder, wav_folder):
    '''
    文件夾讀取函數(shù)
    :param mp3_folder:
    :param wav_folder:
    :return:
    '''
    # 遍歷需要轉(zhuǎn)換的MP3文件夾中的MP3文件
    for a in os.listdir(mp3_folder):
        # 創(chuàng)建MP3文件的絕對路徑
        mp3_file = os.path.join(mp3_folder, a)
        # 調(diào)用格式轉(zhuǎn)換函數(shù)
        trans_to_wav(mp3_file, wav_folder)

def trans_to_wav(mp3_file, wav_folder):
    '''
    格式轉(zhuǎn)換格式
    :param mp3_file:
    :param wav_folder:
    :return:
    '''
    # 格式化文件
    file_fmt = os.path.basename(mp3_file).strip()
    # 獲取文件格式
    file_fmt = file_fmt.split('.')[-1]
    # 校驗文件格式
    if file_fmt.strip() != 'mp3':
        raise Exception('改文件不是MP3格式,請檢查!')
    elif file_fmt.strip() == '':
        raise Exception('文件格式出現(xiàn)異常,請檢查!')
    # 創(chuàng)建wav的文件以供轉(zhuǎn)換完成后輸出
    wav_file_path = os.path.join(wav_folder)
    wav_file_path = os.path.join(wav_file_path, '{}.{}'.format(
        os.path.basename(mp3_file).strip().split('.')[0], 'wav'
    ))
    # 創(chuàng)建轉(zhuǎn)換時的命令行參數(shù)字符串
    cmder = '-f wav -ac 1 -ar 11025'
    # 創(chuàng)建轉(zhuǎn)換器對象
    mpy_obj = mpy(executable='ffmpeg.exe',
        inputs={
            mp3_file: None
        },
        outputs={
            wav_file_path: cmder
        }
    )
    print('執(zhí)行CMDER 命令:{}'.format(mpy_obj.cmd))
    mpy_obj.run()

if __name__ == '__main__':
    '''
    主函數(shù)入口
    '''
    # 輸入MP3文件夾
    mp3_folder = input('輸入MP3文件夾路徑:\n')
    # 校驗MP3文件夾是否存在
    if mp3_folder.strip() == '':
        raise Exception('輸入空值,請檢查!')
    elif mp3_folder.strip() != '':
        if os.path.exists(mp3_folder) is False:
            raise Exception('文件路徑不存在')
    # 輸入wav文件夾路徑
    wav_folder = input('輸入wav文件夾路徑:\n')
    # 校驗wav文件夾是否存在
    if wav_folder.strip() == '':
        raise Exception('輸入空值,請檢查!')
    elif wav_folder.strip() != '':
        if os.path.exists(wav_folder) is False:
            raise Exception('文件路徑不存在')
    # 調(diào)用文件夾讀取批量文件
    read_folder(mp3_folder, wav_folder)

?接下來,我們將利用python,將wav音頻文件傳給motionface即可進行嘴型同步了:文章來源地址http://www.zghlxwxcb.cn/news/detail-614975.html

import sys
import threading
import urllib
import ssl

from urllib.parse import urlparse

from scripts import watcher, webdriver
from config.helper import config
import requests



def sendFile(filename, filepath):
    url =   "http://192.168.3.131:8080/cgi/savewav"
    header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'}
    files = {'file': open(filepath, 'rb') }
    files1 = {
        'file':(filename,open(filepath, 'rb'), 'audio/wav')
    }

    data = {
            'file':filename,
            'objectName': filename,
            'fileDownloadName': filename,
        }
    upload_res = requests.post(url,
                                   data=data,
                                   files=files1)



if __name__ == '__main__':
    print('1')
    sendFile('rec.wav','rec.wav')


到了這里,關(guān)于Python讓AI虛擬主播接入微軟Azure語音合成并精準嘴型同步的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務器費用

相關(guān)文章

  • Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理

    Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理

    目錄 Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理 一、簡單介紹 二、實現(xiàn)原理 三、實現(xiàn)步驟 四、關(guān)鍵代碼 Unity 工具類,自己整理的一些游戲開發(fā)可能用到的模塊,單獨獨立使用,方便游戲開發(fā)。 本節(jié)介紹,這里在使用微軟的Azure 進行語音合成的兩個方

    2024年02月12日
    瀏覽(23)
  • Unity C# 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)以及表情嘴型 Animation 的簡單整理

    Unity C# 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)以及表情嘴型 Animation 的簡單整理

    目錄 Unity C# 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)以及表情嘴型 Animation 的簡單整理 一、簡單介紹 二、實現(xiàn)原理 三、注意事項 四、實現(xiàn)步驟 五、關(guān)鍵代碼 Unity 工具類,自己整理的一些游戲開發(fā)可能用到的模塊,單獨獨立使用,方便游戲開發(fā)。 本節(jié)介紹,這里在使用

    2024年02月12日
    瀏覽(31)
  • azure微軟文字轉(zhuǎn)語音小工具V1.3.2(ai智能配音,目前最好用)的使用說明和下載

    azure微軟文字轉(zhuǎn)語音小工具V1.3.2(ai智能配音,目前最好用)的使用說明和下載

    概括: azure微軟文字轉(zhuǎn)語音小工具是調(diào)用azure服務器的程序,可能是目前最好用的配音軟件。其配音效果幾乎與真人沒有區(qū)別(非常仔細聽可能有些許區(qū)別)。 擁有12種熱門配音聲音,4男8女,可調(diào)整多種情緒,語音速度,音調(diào)自定義,支持幾十個國家語言合成,微軟接口,目

    2024年02月05日
    瀏覽(35)
  • 微軟-文字轉(zhuǎn)語音.語音合成--逆向爬蟲實戰(zhàn)

    微軟-文字轉(zhuǎn)語音.語音合成--逆向爬蟲實戰(zhàn)

    gospider 是一個golang 爬蟲神器,它內(nèi)置了多種爬蟲模塊,是golang 爬蟲必備的工具包 注意:這個地址中有個X-ConnectionId參數(shù),這個參數(shù)寫死或者自己生成假的都可以,這個參數(shù)不重要 這里一個發(fā)送了三次參數(shù),三個參數(shù)中的X-RequestId 值,這個參數(shù)寫死或者自己生成假的都可以,這

    2024年02月11日
    瀏覽(27)
  • 【語音合成】微軟 edge-tts

    目錄 1.?edge-tts 介紹 2. 代碼示例 https://github.com/rany2/edge-tts 在Python代碼中使用Microsoft Edge的在線文本到語音服務

    2024年02月14日
    瀏覽(23)
  • 微軟語音合成(tts)服務申請和調(diào)用

    微軟語音合成(tts)服務申請和調(diào)用

    https://azure.microsoft.com/zh-cn/free/ 這里有個視頻教程,根據(jù)此完成申請流程: https://www.bilibili.com/video/BV15a4y1W7re?vd_source=bf07f28d37849885d215dc3aea189eba 申請完成后,就可以到這里申請資源: https://portal.azure.com/#home 點擊資源組,里面就有部署好的服務了 點擊這里,可以獲取 subscription

    2024年02月11日
    瀏覽(28)
  • 文本轉(zhuǎn)語音:微軟語音合成標記語言 (SSML) 文本結(jié)構(gòu)和事件

    文本轉(zhuǎn)語音:微軟語音合成標記語言 (SSML) 文本結(jié)構(gòu)和事件

    ? SSML 的語音服務實現(xiàn)基于萬維網(wǎng)聯(lián)合會的語音合成標記語言版本 1.0。 ? 語音服務支持的元素可能與 W3C 標準不同。 每個 SSML 文檔是使用 SSML 元素(或標記)創(chuàng)建的。 這些元素用于調(diào)整語音、風格、音節(jié)、韻律、音量等。 下面是 SSML 文檔的基本結(jié)構(gòu)和語法的子集: 以下列

    2024年02月03日
    瀏覽(21)
  • 微軟語音合成助手 TTS-VUE 文字轉(zhuǎn)語音工具

    微軟語音合成助手 TTS-VUE 文字轉(zhuǎn)語音工具

    我們在刷短視頻的時候經(jīng)常會聽到一些AI合成聲音,它們有各種音色、語調(diào),甚至不同的情緒,聽起來與人聲無異 其實這些大都是利用微軟Azure的文字轉(zhuǎn)語音技術(shù)來實現(xiàn)的 雖然國內(nèi)也有很多配音工具,但體驗下來還是微軟的效果最好,語氣最為自然 不過Azure的文字轉(zhuǎn)語音功能

    2024年02月02日
    瀏覽(26)
  • media-微軟Azure文字轉(zhuǎn)語音

    media-微軟Azure文字轉(zhuǎn)語音

    media-微軟Azure文字轉(zhuǎn)語音 前篇 官方 免費服務 - https://portal.azure.com/?quickstart=True#blade/Microsoft_Azure_Billing/FreeServicesBlade 價格表: https://azure.microsoft.com/zh-cn/pricing/details/cognitive-services/speech-services/ 文字轉(zhuǎn)語音–最像人類聲音的免費語音合成服務|微軟azure(2021) - https://www.youtube.com

    2024年02月06日
    瀏覽(29)
  • 文本轉(zhuǎn)語音免費 微軟Azure官網(wǎng),在線就可以轉(zhuǎn)語音。

    文本轉(zhuǎn)語音免費 微軟Azure官網(wǎng),在線就可以轉(zhuǎn)語音。

    使用跨 140 種語言和變體的 400 種神經(jīng)網(wǎng)絡(luò)語音吸引全球受眾。使用極具表現(xiàn)力和類似人類的聲音,使文本閱讀器和已啟用語音的助理等方案栩栩如生。神經(jīng)網(wǎng)絡(luò)文本轉(zhuǎn)語音支持多種朗讀風格,包括新聞廣播、客戶服務、呼喊、耳語以及高興、悲傷等情感。 地址?文本轉(zhuǎn)語音

    2024年02月05日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包