国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

離線語音交互技術(shù)路線之語音合成(TTS)篇

2年前作者：DooDoo~分類：Toy博客閱讀(23)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了離線語音交互技術(shù)路線之語音合成(TTS)篇。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

??在ChatGPT大行其道之際，我心血來潮想要研究研究如何實(shí)現(xiàn)離線語音交互，把它和ChatGPT相結(jié)合，自己嘗試實(shí)現(xiàn)個(gè)語音助手玩玩。本篇文章主要先從整體上分析了離線語音交互的技術(shù)實(shí)現(xiàn)路線，以及每個(gè)環(huán)節(jié)可能用到的參考技術(shù)，然后詳細(xì)闡述了其中一個(gè)環(huán)節(jié)：語音合成（TTS）的實(shí)現(xiàn)方案。

1. 離線語音交互技術(shù)路線

離線語音交互技術(shù)路線之語音合成(TTS)篇
如圖所示，離線語音交互主要由以下幾個(gè)流程組成：

關(guān)鍵詞喚醒：類似于“小愛同學(xué)”這樣的喚醒指令，可用參考技術(shù)：Snowboy；
獲取語音：通過麥克風(fēng)等收音設(shè)備將聲音記錄為音頻文件或數(shù)字信號(hào)，可用參考技術(shù)：speech_recognition；
語音識(shí)別（ASR）：將音頻轉(zhuǎn)換為文本，可用參考技術(shù)：Speechbrain；
語義識(shí)別（NLP）：將人類能夠理解的文本轉(zhuǎn)化為計(jì)算機(jī)可以理解的數(shù)據(jù)，可用參考技術(shù)：NNLM等各類NLP模型；
應(yīng)用層：可以通過理解指令控制設(shè)備（例如智能家居），或與chatbot（例如ChatGPT）進(jìn)行交流
語音合成（TTS）：將文本合成為人類語音（例如導(dǎo)航APP中的人聲合成），可用參考技術(shù)：pyttsx3。

2. 語音合成（TTS）的實(shí)現(xiàn)方案

??pyttsx3能夠?qū)崿F(xiàn)將文本合成為人類語音（例如導(dǎo)航APP中的人聲合成），詳見 pyttsx3官方技術(shù)文檔。

簡單測試：

import pyttsx3
text = """
這是一段測試文本。
"""
pyttsx3.speak(text)

詳細(xì)使用例程：文章來源地址http://www.zghlxwxcb.cn/news/detail-485622.html

import pyttsx3
text = """
這是一段測試文本。
"""
engine = pyttsx3.init()  # 初始化語音引擎
# 設(shè)置語音合成器
voices = engine.getProperty('voices')  # 獲取當(dāng)前設(shè)備支持的語音合成器列表
engine.setProperty('voice',voices[0].id)  # 設(shè)置第一個(gè)語音合成器
# 設(shè)置語速
rate = engine.getProperty('rate')  # 獲取當(dāng)前語速
engine.setProperty('rate', 200)  # 設(shè)置語速
# 設(shè)置音量
volume = engine.getProperty('volume')  # 獲取當(dāng)前音量
engine.setProperty('volume',1.0)  # 設(shè)置音量，范圍為0.0-1.0  默認(rèn)值為1.0

engine.say(text)  # 合成語音
engine.save_to_file(text,'test.mp3')  # 保存語音為音頻文件
engine.runAndWait()
engine.stop()  # 關(guān)閉語言引擎

到了這里，關(guān)于離線語音交互技術(shù)路線之語音合成(TTS)篇的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【語音合成】微軟 edge-tts
目錄 1.?edge-tts 介紹 2. 代碼示例 https://github.com/rany2/edge-tts 在Python代碼中使用Microsoft Edge的在線文本到語音服務(wù)
2024年02月14日
瀏覽(23)
微軟語音合成（tts）服務(wù)申請(qǐng)和調(diào)用
https://azure.microsoft.com/zh-cn/free/ 這里有個(gè)視頻教程，根據(jù)此完成申請(qǐng)流程： https://www.bilibili.com/video/BV15a4y1W7re?vd_source=bf07f28d37849885d215dc3aea189eba 申請(qǐng)完成后，就可以到這里申請(qǐng)資源： https://portal.azure.com/#home 點(diǎn)擊資源組，里面就有部署好的服務(wù)了點(diǎn)擊這里，可以獲取 subscription
2024年02月11日
瀏覽(28)
語音合成工具Coqui TTS安裝及體驗(yàn)
先介紹兩種免費(fèi)的語音合成工具官網(wǎng) http://balabolka.site/balabolka.htm 是一種基于微軟Speech API (SAPI)的免費(fèi)語音合成工具，只是簡單的發(fā)音合成，效果比較生硬官網(wǎng) https://coqui.ai/ 是基于深度學(xué)習(xí)的語音合成軟件，效果較好 Windows下安裝Coqui TTS 安裝環(huán)境要求python運(yùn)行環(huán)境：https://
2024年02月15日
瀏覽(28)
微軟語音合成助手 TTS-VUE 文字轉(zhuǎn)語音工具
我們?cè)谒⒍桃曨l的時(shí)候經(jīng)常會(huì)聽到一些AI合成聲音，它們有各種音色、語調(diào)，甚至不同的情緒，聽起來與人聲無異其實(shí)這些大都是利用微軟Azure的文字轉(zhuǎn)語音技術(shù)來實(shí)現(xiàn)的雖然國內(nèi)也有很多配音工具，但體驗(yàn)下來還是微軟的效果最好，語氣最為自然不過Azure的文字轉(zhuǎn)語音功能
2024年02月02日
瀏覽(26)
Python使用PaddleSpeech實(shí)現(xiàn)語音識(shí)別（ASR）、語音合成（TTS）
目錄安裝語音識(shí)別補(bǔ)全標(biāo)點(diǎn) 語音合成參考 PaddleSpeech是百度飛槳開發(fā)的語音工具注意，PaddleSpeech不支持過高版本的Python，因?yàn)樵诟甙姹镜腜ython中，飛槳不再提供paddle.fluid API。這里面我用的是Python3.7 需要通過3個(gè)pip命令安裝PaddleSpeech：在使用的時(shí)候，urllib3庫可能會(huì)報(bào)錯(cuò)，因
2024年04月25日
瀏覽(29)
TTS | 語音合成常見數(shù)據(jù)集及數(shù)據(jù)格式詳情
本文主要詳細(xì)介紹了語音中最常見的數(shù)據(jù)集（包含各個(gè)語種），及其格式等~ 目錄 1.外語數(shù)據(jù)集 1.1.LJSpeech 單人 1.2.JSUT 1.3.RUSLAN 1.4.RyanSpeech 1.5.VocBench 1.6.Arabic Speech Corpus 1.7.Silent Speech EMG 1.8.Hi-Fi Multi-Speaker English TTS Dataset 1.9.KSS 單人 1.10.VCTK 多人 1.11.LibriTTS 多人 2.多任務(wù)數(shù)據(jù)集 2
2024年02月05日
瀏覽(26)
【TTS】uni-app語音播報(bào)app開發(fā) / MT-TTS安卓原生自帶語音合成插件（免費(fèi)無限次）
TTS 是 Text To Speech 的縮寫，即“ 從文本到語音 ”，是人機(jī)對(duì)話的一部分，讓機(jī)器能夠說話。TTS是語音合成應(yīng)用的一種。在程序開發(fā)中，有很多TTS的插件，比如百度，訊飛，等等，但是大部分產(chǎn)品都不是完全免費(fèi)無限制次數(shù)調(diào)用的且需在線使用本篇文章介紹一種免費(fèi)快捷且可
2023年04月15日
瀏覽(84)
uniapp開發(fā)小程序接入阿里云TTS語音合成（RESTful API）
流程首先小程序后臺(tái)配置白名單 1.1 路徑：開發(fā)-開發(fā)管理-開發(fā)設(shè)置-服務(wù)器域名-request合法域名 1.2 request合法域名參數(shù)： ???? ?https://nls-meta.cn-shanghai.aliyuncs.com ???? ?https://nls-gateway-cn-shanghai.aliyuncs.com 引入alitts.js 頁面使用 3.1 只需替換AccessKeyID、AccessKeySecret 、appkey三個(gè)參數(shù)
2024年02月06日
瀏覽(20)
Unity 工具之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理
目錄 Unity 工具之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理一、簡單介紹二、實(shí)現(xiàn)原理三、實(shí)現(xiàn)步驟四、關(guān)鍵代碼 Unity 工具類，自己整理的一些游戲開發(fā)可能用到的模塊，單獨(dú)獨(dú)立使用，方便游戲開發(fā)。本節(jié)介紹，這里在使用微軟的Azure 進(jìn)行語音合成的兩個(gè)方
2024年02月12日
瀏覽(23)
瀏覽器原生JavaScript離線文字轉(zhuǎn)語音TTS播放，支持Windows自帶TTS語音和移動(dòng)端（安卓、IOS）
JS已經(jīng)可以實(shí)現(xiàn)語音合成（文字轉(zhuǎn)語音）和語音識(shí)別（語音轉(zhuǎn)文字），各個(gè)瀏覽器支持列表如下所示：語音識(shí)別支持列表：因此，瀏覽器上面使用語音合成非常簡單。頁面效果示例： 1、支持速度，音調(diào)設(shè)置 2、支持下拉選擇語音模板 3、文字轉(zhuǎn)語音該文件可直接保存成htm
2024年02月04日
瀏覽(28)