国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【AI】文本轉(zhuǎn)語音 變聲 音色克隆 數(shù)字人音視頻口型同步AI應(yīng)用

這篇具有很好參考價值的文章主要介紹了【AI】文本轉(zhuǎn)語音 變聲 音色克隆 數(shù)字人音視頻口型同步AI應(yīng)用。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

文本轉(zhuǎn)語音

項目地址:https://github.com/coqui-ai/TTS

環(huán)境安裝:

  1. 下載項目;
  2. 安裝Python,安裝項目依賴:
pip install TTS
1. 下載安裝AI模型:

https://github.com/facebookresearch/fairseq/tree/main/examples/mms

模型文件放到:C:\Users\Administrator\AppData\Local\tts

2. 將文本轉(zhuǎn)換為語音:

tts --text “要轉(zhuǎn)換的文本內(nèi)容” --model_name “指定語音模型” --out_path .\outFile.wav?

語音模型可通過命令tts –list_models列出

示例(使用中文語音模型):

tts --text "你好,中文。" --model_name "tts_models/zh-CN/baker/tacotron2-DDC-GST" --out_path .\test.wav
3. 自定義人聲:

就是給定一段語音,生成語音的音色就會與給定語音相似。也就是自定義人聲。

自定義人聲需要依賴xtts模型,下載地址:https://huggingface.co/coqui/XTTS-v2/tree/main

也可以通過以下命令行下載:

git lfs install
git clone https://huggingface.co/coqui/XTTS-v2

?下載的模型文件必須放到特定文件夾:C:\Users\Administrator\AppData\Local\tts\tts_models--multilingual--multi-dataset--xtts_v2

?使用以下命令生成自定義人聲的語音:

tts --model_name tts_models/multilingual/multi-dataset/xtts_v2 --language_idx zh-cn --speaker_wav ./out/output.wav --text "感謝榜一大哥,王思春送來的一發(fā)火箭。" --out_path ./out/ai_output.wav

語音轉(zhuǎn)語音(變聲)

項目地址:https://github.com/voicepaw/so-vits-svc-fork

1. 環(huán)境安裝:
  1. 下載項目;
  2. 安裝依賴:pip install –r requirements.txt
  3. 下載語音模型:

https://huggingface.co/models?search=so-vits-svc

https://civitai.com/?query=so-vits-svc

模型存放目錄結(jié)構(gòu)configs/模型文件.pth;configs/44k/config.json

2. 使用方法:

1. GUI使用:

命令: svc gui打開UI界面

tts_models–zh-cn–baker–tacotron2-ddc-gst,AI應(yīng)用,人工智能,音視頻,AI變聲,音視頻合成,數(shù)字人,TTS

選擇模型文件、模型配置文件、原語音文件wav;

點擊Infer按鈕生成語音文件;

2. 使用命令行:

svc infer C:\Users\Administrator\Desktop\test.wav -m "C:\Users\Administrator\Desktop\configs"

視頻同步語音口型

項目地址:https://github.com/OpenTalker/video-retalking

1. 環(huán)境安裝:
  1. 下載項目;
  2. 安裝conda:Index of /anaconda/miniconda/ | 清華大學(xué)開源軟件鏡像站 | Tsinghua Open Source Mirror
  3. 使用conda創(chuàng)建python環(huán)境:

conda create -n video_retalking python=3.8

conda activate video_retalking

  1. 安裝依賴:

conda install ffmpeg

pip install -r requirements.txt
  1. AI模型下載:https://drive.google.com/drive/folders/18rhjMpxK8LVVxf7PI6XwOidt8Vouv_H0?usp=share_link

在項目工程下新建checkpoints文件夾并將模型全部文件放入文件夾;文章來源地址http://www.zghlxwxcb.cn/news/detail-826487.html

2. 使用方法:
.\inference --face 3.mp4 --audio D:\Workspace\TTS-0.21.3\test.wav --outfile C:\Users\Administrator\Desktop\out_3.mp4

到了這里,關(guān)于【AI】文本轉(zhuǎn)語音 變聲 音色克隆 數(shù)字人音視頻口型同步AI應(yīng)用的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 栩栩如生,音色克隆,Bert-vits2文字轉(zhuǎn)語音打造鬼畜視頻實踐(Python3.10)

    諸公可知目前最牛逼的TTS免費開源項目是哪一個?沒錯,是Bert-vits2,沒有之一。它是在本來已經(jīng)極其強大的Vits項目中融入了Bert大模型,基本上解決了VITS的語氣韻律問題,在效果非常出色的情況下訓(xùn)練的成本開銷普通人也完全可以接受。 BERT的核心思想是通過在大規(guī)模文本語

    2024年02月08日
    瀏覽(19)
  • AI 語音 - 人物音色訓(xùn)練

    AI 語音 - 人物音色訓(xùn)練

    前情提要 2023-07-02 周日 杭州 陰晴不定 AI 入門三大項,AI 繪畫基礎(chǔ)學(xué)習(xí),AI 語音合成,AI 智能對話訓(xùn)練,進入 AI 語音合成階段了,搓搓小手很激動的,對于一個五音不全的我來說,這個簡直了(擺脫了低級趣味,保留點好色就夠了); ** 時間線 ** a. 2021 年函數(shù)計算編程大賽;

    2024年02月12日
    瀏覽(16)
  • 【AI 孫燕姿 | AI 音色克隆】RVC 使用圖文教程:無難度男女換聲(偽音)、 AI 孫燕姿

    【AI 孫燕姿 | AI 音色克隆】RVC 使用圖文教程:無難度男女換聲(偽音)、 AI 孫燕姿

    最近,視頻網(wǎng)站音樂區(qū)up主掀了“AI孫燕姿”的風(fēng)潮。這種使用AI技術(shù)提取某位歌手的音色,再用其替換另一位歌手音色的方式,可以實現(xiàn)接近歌手本人翻唱的逼真效果。除孫燕姿外,面對周杰倫、陶喆、陳奕迅、王菲等眾多具有獨特嗓音的歌手,歌迷紛紛奔向“AI點唱機”—

    2024年02月08日
    瀏覽(22)
  • ?AI 孫燕姿 | AI 音色克隆?RVC 使用圖文教程?無難度男女換聲(偽音)、 AI 孫燕姿!

    ?AI 孫燕姿 | AI 音色克隆?RVC 使用圖文教程?無難度男女換聲(偽音)、 AI 孫燕姿!

    最近,視頻網(wǎng)站音樂區(qū)up主掀了“AI孫燕姿”的風(fēng)潮。這種使用AI技術(shù)提取某位歌手的音色,再用其替換另一位歌手音色的方式,可以實現(xiàn)接近歌手本人翻唱的逼真效果。除孫燕姿外,面對周杰倫、陶喆、陳奕迅、王菲等眾多具有獨特嗓音的歌手,歌迷紛紛奔向“AI點唱機”—

    2024年02月08日
    瀏覽(114)
  • AI語音變聲器學(xué)習(xí)記錄:RVC和SVC

    AI語音變聲器學(xué)習(xí)記錄:RVC和SVC

    ????????玩了兩個多月的AI語音,還是挺有意思的,收獲頗多,不禁讓人感嘆AI已經(jīng)進化到如此境界了,之前還有AI實時換臉的,兩者配合起來使用簡直讓人不敢想象,這世上還有什么是真的??傊褪亲鲆粋€學(xué)習(xí)記錄,從下載到訓(xùn)練到推理到使用推理出來的音頻做視頻之內(nèi)

    2024年02月06日
    瀏覽(23)
  • linux 運行開源音視頻livekit,實現(xiàn)html視頻語音聊天。

    linux 運行開源音視頻livekit,實現(xiàn)html視頻語音聊天。

    linux版本: centos 7.9 先附上官方本地安裝文檔: Running LiveKit locally | LiveKit Docs 步驟: 1、首先在linux里面安裝運行l(wèi)ivekit: livekit.yaml文件的內(nèi)容: 注意use_external_ip一定要設(shè)置true.這個是啟用外部ip訪問的。 然后就是keys:這個是創(chuàng)建token需要的, 前面的APIbxDWetqcjHaa是apikey, 后面的

    2024年03月26日
    瀏覽(13)
  • 【python】fastapi response返回文本、音視頻多媒體資源實現(xiàn)

    HTMLResponse 是FastAPI中自帶的一個響應(yīng)類,用于返回HTML格式的響應(yīng)。使用方法如下: 在上面的例子中,我們在裝飾器中指定了 response_class=HTMLResponse ,表示我們需要返回一個HTML響應(yīng)。然后在函數(shù)中,我們返回了一個HTML格式的字符串。FastAPI會自動將這個字符串封裝成一個 HTMLR

    2023年04月27日
    瀏覽(27)
  • 從數(shù)字圖像到音視頻學(xué)習(xí):我的學(xué)習(xí)之旅

    從數(shù)字圖像到音視頻學(xué)習(xí):我的學(xué)習(xí)之旅

    數(shù)字圖像是一門廣泛應(yīng)用于計算機視覺、圖像處理和計算機圖形學(xué)等領(lǐng)域的學(xué)科,而音視頻學(xué)習(xí)則涵蓋了音頻和視頻的處理、分析和應(yīng)用。 如果你最開始接觸數(shù)字圖像,可能會學(xué)習(xí)一些基本概念,例如像素、分辨率、色彩空間和圖像處理算法等。這可能涉及到使用編程語言(

    2024年02月11日
    瀏覽(24)
  • 網(wǎng)站在線客服系統(tǒng)實時語音視頻聊天實戰(zhàn)開發(fā),利用peerjs vue.js實現(xiàn)webRTC網(wǎng)頁音視頻客服系統(tǒng)...

    網(wǎng)站在線客服系統(tǒng)實時語音視頻聊天實戰(zhàn)開發(fā),利用peerjs vue.js實現(xiàn)webRTC網(wǎng)頁音視頻客服系統(tǒng)...

    webRTC機制和peerjs庫的介紹在其他博客中已經(jīng)有了很多介紹,這里我直接搬運過來 WebRTC(Web Real-Time Communication)即:網(wǎng)頁即時通信。 簡單點講,它可以實現(xiàn)瀏覽器網(wǎng)頁與網(wǎng)頁之間的音視頻實時通信(或傳輸其它任何數(shù)據(jù)),目前主流瀏覽器都支持該API,WebRTC現(xiàn)在已經(jīng)納入W3C標(biāo)準(zhǔn)。

    2024年02月04日
    瀏覽(29)
  • [AI語音克隆] 5秒內(nèi)克隆您的聲音并生成任意語音內(nèi)容

    [AI語音克隆] 5秒內(nèi)克隆您的聲音并生成任意語音內(nèi)容

    隨著人工智能技術(shù)的不斷發(fā)展,語音克隆技術(shù)也得到了越來越多的關(guān)注和研究。目前,AI語音克隆技術(shù)已經(jīng)可以實現(xiàn)讓機器模擬出一個人的聲音,甚至可以讓機器模擬出一個人的語言習(xí)慣和表情。 然而,AI語音克隆技術(shù)仍然面臨著許多難點和痛點。首先,現(xiàn)有的語音克隆技術(shù)

    2024年02月08日
    瀏覽(19)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包