国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

語音合成工具Coqui TTS安裝及體驗

這篇具有很好參考價值的文章主要介紹了語音合成工具Coqui TTS安裝及體驗。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

先介紹兩種免費的語音合成工具

balabolka

官網(wǎng)
http://balabolka.site/balabolka.htm
是一種基于微軟Speech API (SAPI)的免費語音合成工具,只是簡單的發(fā)音合成,效果比較生硬

Coqui TTS

官網(wǎng)
https://coqui.ai/
是基于深度學(xué)習(xí)的語音合成軟件,效果較好

Windows下安裝Coqui TTS

安裝環(huán)境
要求python運(yùn)行環(huán)境:https://www.python.org/downloads/windows/
本文基于版本:python-3.8.10-amd64.exe,并且自行更新并設(shè)置好pip安裝源

pip安裝Coqui TTS

pip install tts

會安裝機(jī)器學(xué)習(xí)庫torch,以及大量相關(guān)組件包,大約1G多

Successfully installed Babel-2.12.1 Jinja2-3.1.2 MarkupSafe-2.1.2 TTS-0.11.1 Wer
kzeug-2.2.3 anyascii-0.3.1 audioread-3.0.0 backports.zoneinfo-0.2.1 certifi-2022
.12.7 cffi-1.15.1 charset-normalizer-3.1.0 click-8.1.3 colorama-0.4.6 coqpit-0.0
.17 cython-0.29.28 dateparser-1.1.7 decorator-5.1.1 docopt-0.6.2 flask-2.2.3 fss
pec-2023.3.0 g2pkk-0.1.2 gruut-2.2.3 gruut-ipa-0.13.0 gruut_lang_de-2.0.0 gruut_
lang_en-2.0.0 idna-3.4 importlib-metadata-6.0.0 importlib_resources-5.12.0 infle
ct-5.6.0 itsdangerous-2.1.2 jamo-0.4.1 jieba-0.42.1 joblib-1.2.0 jsonlines-1.2.0
 librosa-0.8.0 llvmlite-0.38.1 mecab-python3-1.0.5 networkx-2.8.8 nltk-3.8.1 num
2words-0.5.12 numba-0.55.1 numpy-1.21.6 pandas-1.5.3 platformdirs-3.1.1 pooch-1.
7.0 protobuf-3.19.6 psutil-5.9.4 pycparser-2.21 pynndescent-0.5.8 pypinyin-0.48.
0 pysbd-0.3.4 python-crfsuite-0.9.9 pytz-2022.7.1 pytz-deprecation-shim-0.1.0.po
st0 pyyaml-6.0 regex-2022.10.31 requests-2.28.2 resampy-0.4.2 scikit-learn-1.2.2
 scipy-1.10.1 soundfile-0.12.1 tensorboardX-2.6 threadpoolctl-3.1.0 torch-1.13.1
 torchaudio-0.13.1 tqdm-4.65.0 trainer-0.0.20 typing-extensions-4.5.0 tzdata-202
2.7 tzlocal-4.2 umap-learn-0.5.1 unidic-lite-1.0.8 urllib3-1.26.15 zipp-3.15.0

安裝完之后就能直接在命令行使用tts工具(要求系統(tǒng)環(huán)境變量path中包含Python User安裝目錄:Python38\Scripts)
查看本地所有模型

tts --list_models

執(zhí)行測試命令

tts --text "Hello world." --out_path aaa.wav

這時會下載模型列表中第一項:https://coqui.gateway.scarf.sh/v0.10.1_models/tts_models–multilingual–multi-dataset–your_tts.zip,然而這個鏈接我這邊從來沒有成功下載過
只能手動從github下載
https://github.com/coqui-ai/TTS/releases/tag/v0.10.1_models
下載其中的tts_models–zh-CN–baker–tacotron2-DDC-GST.zip,這是YourTTS的多人訓(xùn)練模型,里邊只有英語、法語、西班牙語
下載之后解壓縮到

%USERPROFILE%\AppData\Local\tts

再次使用命令:–list_models,就能看到第一條模型已經(jīng)下載,理論上到這里就能正確輸出語音了,但是我這邊又遇到兩個問題

缺少avdevice-58.dll

語音合成工具Coqui TTS安裝及體驗,python,語音合成這是因為缺少ffmpeg運(yùn)行環(huán)境,訪問官網(wǎng):https://ffmpeg.org/download.html,查看可知libavdevice 58要求的版本是4.4.3
從官網(wǎng)引導(dǎo)找到:https://github.com/BtbN/FFmpeg-Builds/releases/tag/autobuild-2023-03-13-12-46
下載其中的:ffmpeg-n4.4.3-3-gb48951bd29-win64-lgpl-shared-4.4.zip
解壓縮其中以下幾個dll拷貝到Python User安裝目錄:Python38\Scripts,即可
語音合成工具Coqui TTS安裝及體驗,python,語音合成還有一種更簡單的方案,如果系統(tǒng)中已經(jīng)安裝微信、QQ,直接復(fù)制其安裝目錄下的avdevice-58.dll到Python38\Scripts同樣也可以

_MeCab: 找不到指定的模塊。

這個就奇了怪了,試過很多方法包括從
https://github.com/ikegami-yukino/mecab/releases/tag/v0.996.2
安裝:mecab-64-0.996.2.exe,拷貝libmecab.lib、libmecab.dll,更新vsruntime都無法解決
后來看到一個issue:https://github.com/coqui-ai/TTS/issues/711
語音合成工具Coqui TTS安裝及體驗,python,語音合成得到啟發(fā),雖然我用的版本不同,但方法類似,通過查找到python tts目錄下使用MeCab的地方
語音合成工具Coqui TTS安裝及體驗,python,語音合成添加注釋#,關(guān)閉MeCab引用,就能順利運(yùn)行tts了

下載中文語音模型

由于tts默認(rèn)下載連接總是不成功,所以還是手動下載:https://github.com/coqui-ai/TTS/releases/tag/v0.6.1_models
下載其中:tts_models–zh-CN–baker–tacotron2-DDC-GST.zip
同樣解壓縮到

%USERPROFILE%\AppData\Local\tts

合成中文語音

進(jìn)過一番折騰,終于能夠順利合成中文語音,命令中需要指定中文模型

tts --text "知是行之始,行是知之成。" --out_path aaa.wav --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST

在python中使用中文語音合成

from TTS.api import TTS
tts=TTS("tts_models/zh-CN/baker/tacotron2-DDC-GST")
tts.tts_to_file(text="知是行之始,行是知之成。", file_path="aaa.wav")

參考

https://github.com/coqui-ai/TTS
https://tts.readthedocs.io/en/latest/index.html
https://github.com/Edresson/YourTTS
https://github.com/SamuraiT/mecab-python3/issues/46
https://blog.csdn.net/Haulyn5/article/details/126770543
https://blog.csdn.net/ZYXpaidaxing/article/details/81913708
https://blog.csdn.net/weixin_43816759/article/details/119277486文章來源地址http://www.zghlxwxcb.cn/news/detail-609014.html

到了這里,關(guān)于語音合成工具Coqui TTS安裝及體驗的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Python使用PaddleSpeech實現(xiàn)語音識別(ASR)、語音合成(TTS)

    Python使用PaddleSpeech實現(xiàn)語音識別(ASR)、語音合成(TTS)

    目錄 安裝 語音識別 補(bǔ)全標(biāo)點 語音合成 參考 PaddleSpeech是百度飛槳開發(fā)的語音工具 注意,PaddleSpeech不支持過高版本的Python,因為在高版本的Python中,飛槳不再提供paddle.fluid API。這里面我用的是Python3.7 需要通過3個pip命令安裝PaddleSpeech: 在使用的時候,urllib3庫可能會報錯,因

    2024年04月25日
    瀏覽(28)
  • 體驗最佳的一個TTS文字轉(zhuǎn)語音工具

    文本轉(zhuǎn)語音 (TTS) 技術(shù)在當(dāng)今的數(shù)字世界中變得越來越流行,其應(yīng)用范圍從語音導(dǎo)航到教學(xué)視頻、教育和娛樂。 TTS 技術(shù)允許用戶將文本轉(zhuǎn)換為語音,使其成為一種極其方便、高效和靈活的交流方式。 個人的使用場景是抖音短視頻語音配音和電影解說,嘗試了很多網(wǎng)站和工具,

    2024年02月15日
    瀏覽(19)
  • Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理

    Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理

    目錄 Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理 一、簡單介紹 二、實現(xiàn)原理 三、實現(xiàn)步驟 四、關(guān)鍵代碼 Unity 工具類,自己整理的一些游戲開發(fā)可能用到的模塊,單獨獨立使用,方便游戲開發(fā)。 本節(jié)介紹,這里在使用微軟的Azure 進(jìn)行語音合成的兩個方

    2024年02月12日
    瀏覽(23)
  • 新一代開源語音庫CoQui TTS沖到了GitHub 20.5k Star

    新一代開源語音庫CoQui TTS沖到了GitHub 20.5k Star

    Coqui TTS 項目介紹 Coqui 文本轉(zhuǎn)語音(Text-to-Speech,TTS)是新一代基于深度學(xué)習(xí)的低資源零樣本文本轉(zhuǎn)語音模型,具有合成多種語言語音的能力。該模型能夠利用共同學(xué)習(xí)技術(shù),從各語言的訓(xùn)練資料集轉(zhuǎn)換知識,來有效降低需要的訓(xùn)練資料量。 這個模型庫現(xiàn)在已經(jīng)在GitHub上開源

    2024年02月07日
    瀏覽(22)
  • 離線語音交互技術(shù)路線之語音合成(TTS)篇

    離線語音交互技術(shù)路線之語音合成(TTS)篇

    ??在ChatGPT大行其道之際,我心血來潮想要研究研究如何實現(xiàn)離線語音交互,把它和ChatGPT相結(jié)合,自己嘗試實現(xiàn)個語音助手玩玩。本篇文章主要先從整體上分析了離線語音交互的技術(shù)實現(xiàn)路線,以及每個環(huán)節(jié)可能用到的參考技術(shù),然后詳細(xì)闡述了其中一個環(huán)節(jié):語音合成(

    2024年02月09日
    瀏覽(22)
  • 【語音合成】微軟 edge-tts

    目錄 1.?edge-tts 介紹 2. 代碼示例 https://github.com/rany2/edge-tts 在Python代碼中使用Microsoft Edge的在線文本到語音服務(wù)

    2024年02月14日
    瀏覽(23)
  • 微軟語音合成(tts)服務(wù)申請和調(diào)用

    微軟語音合成(tts)服務(wù)申請和調(diào)用

    https://azure.microsoft.com/zh-cn/free/ 這里有個視頻教程,根據(jù)此完成申請流程: https://www.bilibili.com/video/BV15a4y1W7re?vd_source=bf07f28d37849885d215dc3aea189eba 申請完成后,就可以到這里申請資源: https://portal.azure.com/#home 點擊資源組,里面就有部署好的服務(wù)了 點擊這里,可以獲取 subscription

    2024年02月11日
    瀏覽(28)
  • TTS | 語音合成常見數(shù)據(jù)集及數(shù)據(jù)格式詳情

    TTS | 語音合成常見數(shù)據(jù)集及數(shù)據(jù)格式詳情

    本文主要詳細(xì)介紹了語音中最常見的數(shù)據(jù)集(包含各個語種),及其格式等~ 目錄 1.外語數(shù)據(jù)集 1.1.LJSpeech 單人 1.2.JSUT 1.3.RUSLAN 1.4.RyanSpeech 1.5.VocBench 1.6.Arabic Speech Corpus 1.7.Silent Speech EMG 1.8.Hi-Fi Multi-Speaker English TTS Dataset 1.9.KSS 單人 1.10.VCTK 多人 1.11.LibriTTS 多人 2.多任務(wù)數(shù)據(jù)集 2

    2024年02月05日
    瀏覽(26)
  • TTS合成技術(shù)中的語音合成和人工智能和自然語言生成

    TTS合成技術(shù)中的語音合成和人工智能和自然語言生成是當(dāng)前人工智能技術(shù)應(yīng)用中的重要領(lǐng)域。本文旨在介紹TTS合成技術(shù)中的語音合成、人工智能和自然語言生成的概念和技術(shù)原理,并給出實現(xiàn)步驟和優(yōu)化建議,旨在幫助讀者更好地理解這個領(lǐng)域的技術(shù)細(xì)節(jié)和發(fā)展趨勢。 TTS合成

    2024年02月07日
    瀏覽(26)
  • 【TTS】uni-app語音播報app開發(fā) / MT-TTS安卓原生自帶語音合成插件(免費無限次)

    【TTS】uni-app語音播報app開發(fā) / MT-TTS安卓原生自帶語音合成插件(免費無限次)

    TTS 是 Text To Speech 的縮寫,即“ 從文本到語音 ”,是人機(jī)對話的一部分,讓機(jī)器能夠說話。TTS是語音合成應(yīng)用的一種。 在程序開發(fā)中,有很多TTS的插件,比如百度,訊飛,等等,但是大部分產(chǎn)品都不是完全免費無限制次數(shù)調(diào)用的且需在線使用 本篇文章介紹一種免費快捷且可

    2023年04月15日
    瀏覽(84)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包