国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

離線語音交互技術(shù)路線之語音合成(TTS)篇

這篇具有很好參考價(jià)值的文章主要介紹了離線語音交互技術(shù)路線之語音合成(TTS)篇。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

??在ChatGPT大行其道之際,我心血來潮想要研究研究如何實(shí)現(xiàn)離線語音交互,把它和ChatGPT相結(jié)合,自己嘗試實(shí)現(xiàn)個(gè)語音助手玩玩。本篇文章主要先從整體上分析了離線語音交互的技術(shù)實(shí)現(xiàn)路線,以及每個(gè)環(huán)節(jié)可能用到的參考技術(shù),然后詳細(xì)闡述了其中一個(gè)環(huán)節(jié):語音合成(TTS)的實(shí)現(xiàn)方案。

1. 離線語音交互技術(shù)路線

離線語音交互技術(shù)路線之語音合成(TTS)篇
如圖所示,離線語音交互主要由以下幾個(gè)流程組成:

  1. 關(guān)鍵詞喚醒:類似于“小愛同學(xué)”這樣的喚醒指令,可用參考技術(shù):Snowboy;
  2. 獲取語音:通過麥克風(fēng)等收音設(shè)備將聲音記錄為音頻文件或數(shù)字信號(hào),可用參考技術(shù):speech_recognition;
  3. 語音識(shí)別(ASR):將音頻轉(zhuǎn)換為文本,可用參考技術(shù):Speechbrain;
  4. 語義識(shí)別(NLP):將人類能夠理解的文本轉(zhuǎn)化為計(jì)算機(jī)可以理解的數(shù)據(jù),可用參考技術(shù):NNLM等各類NLP模型;
  5. 應(yīng)用層:可以通過理解指令控制設(shè)備(例如智能家居),或與chatbot(例如ChatGPT)進(jìn)行交流
  6. 語音合成(TTS):將文本合成為人類語音(例如導(dǎo)航APP中的人聲合成),可用參考技術(shù):pyttsx3。

2. 語音合成(TTS)的實(shí)現(xiàn)方案

??pyttsx3能夠?qū)崿F(xiàn)將文本合成為人類語音(例如導(dǎo)航APP中的人聲合成),詳見 pyttsx3官方技術(shù)文檔 。

簡單測試:

import pyttsx3
text = """
這是一段測試文本。
"""
pyttsx3.speak(text)

詳細(xì)使用例程:文章來源地址http://www.zghlxwxcb.cn/news/detail-485622.html

import pyttsx3
text = """
這是一段測試文本。
"""
engine = pyttsx3.init()  # 初始化語音引擎
# 設(shè)置語音合成器
voices = engine.getProperty('voices')  # 獲取當(dāng)前設(shè)備支持的語音合成器列表
engine.setProperty('voice',voices[0].id)  # 設(shè)置第一個(gè)語音合成器
# 設(shè)置語速
rate = engine.getProperty('rate')  # 獲取當(dāng)前語速
engine.setProperty('rate', 200)  # 設(shè)置語速
# 設(shè)置音量
volume = engine.getProperty('volume')  # 獲取當(dāng)前音量
engine.setProperty('volume',1.0)  # 設(shè)置音量,范圍為0.0-1.0  默認(rèn)值為1.0

engine.say(text)  # 合成語音
engine.save_to_file(text,'test.mp3')  # 保存語音為音頻文件
engine.runAndWait()
engine.stop()  # 關(guān)閉語言引擎

到了這里,關(guān)于離線語音交互技術(shù)路線之語音合成(TTS)篇的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【語音合成】微軟 edge-tts

    目錄 1.?edge-tts 介紹 2. 代碼示例 https://github.com/rany2/edge-tts 在Python代碼中使用Microsoft Edge的在線文本到語音服務(wù)

    2024年02月14日
    瀏覽(23)
  • 微軟語音合成(tts)服務(wù)申請(qǐng)和調(diào)用

    微軟語音合成(tts)服務(wù)申請(qǐng)和調(diào)用

    https://azure.microsoft.com/zh-cn/free/ 這里有個(gè)視頻教程,根據(jù)此完成申請(qǐng)流程: https://www.bilibili.com/video/BV15a4y1W7re?vd_source=bf07f28d37849885d215dc3aea189eba 申請(qǐng)完成后,就可以到這里申請(qǐng)資源: https://portal.azure.com/#home 點(diǎn)擊資源組,里面就有部署好的服務(wù)了 點(diǎn)擊這里,可以獲取 subscription

    2024年02月11日
    瀏覽(28)
  • 語音合成工具Coqui TTS安裝及體驗(yàn)

    語音合成工具Coqui TTS安裝及體驗(yàn)

    先介紹兩種免費(fèi)的語音合成工具 官網(wǎng) http://balabolka.site/balabolka.htm 是一種基于微軟Speech API (SAPI)的免費(fèi)語音合成工具,只是簡單的發(fā)音合成,效果比較生硬 官網(wǎng) https://coqui.ai/ 是基于深度學(xué)習(xí)的語音合成軟件,效果較好 Windows下安裝Coqui TTS 安裝環(huán)境 要求python運(yùn)行環(huán)境:https://

    2024年02月15日
    瀏覽(28)
  • 微軟語音合成助手 TTS-VUE 文字轉(zhuǎn)語音工具

    微軟語音合成助手 TTS-VUE 文字轉(zhuǎn)語音工具

    我們?cè)谒⒍桃曨l的時(shí)候經(jīng)常會(huì)聽到一些AI合成聲音,它們有各種音色、語調(diào),甚至不同的情緒,聽起來與人聲無異 其實(shí)這些大都是利用微軟Azure的文字轉(zhuǎn)語音技術(shù)來實(shí)現(xiàn)的 雖然國內(nèi)也有很多配音工具,但體驗(yàn)下來還是微軟的效果最好,語氣最為自然 不過Azure的文字轉(zhuǎn)語音功能

    2024年02月02日
    瀏覽(26)
  • Python使用PaddleSpeech實(shí)現(xiàn)語音識(shí)別(ASR)、語音合成(TTS)

    Python使用PaddleSpeech實(shí)現(xiàn)語音識(shí)別(ASR)、語音合成(TTS)

    目錄 安裝 語音識(shí)別 補(bǔ)全標(biāo)點(diǎn) 語音合成 參考 PaddleSpeech是百度飛槳開發(fā)的語音工具 注意,PaddleSpeech不支持過高版本的Python,因?yàn)樵诟甙姹镜腜ython中,飛槳不再提供paddle.fluid API。這里面我用的是Python3.7 需要通過3個(gè)pip命令安裝PaddleSpeech: 在使用的時(shí)候,urllib3庫可能會(huì)報(bào)錯(cuò),因

    2024年04月25日
    瀏覽(29)
  • TTS | 語音合成常見數(shù)據(jù)集及數(shù)據(jù)格式詳情

    TTS | 語音合成常見數(shù)據(jù)集及數(shù)據(jù)格式詳情

    本文主要詳細(xì)介紹了語音中最常見的數(shù)據(jù)集(包含各個(gè)語種),及其格式等~ 目錄 1.外語數(shù)據(jù)集 1.1.LJSpeech 單人 1.2.JSUT 1.3.RUSLAN 1.4.RyanSpeech 1.5.VocBench 1.6.Arabic Speech Corpus 1.7.Silent Speech EMG 1.8.Hi-Fi Multi-Speaker English TTS Dataset 1.9.KSS 單人 1.10.VCTK 多人 1.11.LibriTTS 多人 2.多任務(wù)數(shù)據(jù)集 2

    2024年02月05日
    瀏覽(26)
  • 【TTS】uni-app語音播報(bào)app開發(fā) / MT-TTS安卓原生自帶語音合成插件(免費(fèi)無限次)

    【TTS】uni-app語音播報(bào)app開發(fā) / MT-TTS安卓原生自帶語音合成插件(免費(fèi)無限次)

    TTS 是 Text To Speech 的縮寫,即“ 從文本到語音 ”,是人機(jī)對(duì)話的一部分,讓機(jī)器能夠說話。TTS是語音合成應(yīng)用的一種。 在程序開發(fā)中,有很多TTS的插件,比如百度,訊飛,等等,但是大部分產(chǎn)品都不是完全免費(fèi)無限制次數(shù)調(diào)用的且需在線使用 本篇文章介紹一種免費(fèi)快捷且可

    2023年04月15日
    瀏覽(84)
  • uniapp開發(fā)小程序接入阿里云TTS語音合成(RESTful API)

    流程 首先小程序后臺(tái)配置白名單 1.1 路徑:開發(fā)-開發(fā)管理-開發(fā)設(shè)置-服務(wù)器域名-request合法域名 1.2 request合法域名參數(shù): ???? ?https://nls-meta.cn-shanghai.aliyuncs.com ???? ?https://nls-gateway-cn-shanghai.aliyuncs.com 引入alitts.js 頁面使用 3.1 只需替換AccessKeyID、AccessKeySecret 、appkey三個(gè)參數(shù)

    2024年02月06日
    瀏覽(20)
  • Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理

    Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理

    目錄 Unity 工具 之 Azure 微軟SSML語音合成TTS流式獲取音頻數(shù)據(jù)的簡單整理 一、簡單介紹 二、實(shí)現(xiàn)原理 三、實(shí)現(xiàn)步驟 四、關(guān)鍵代碼 Unity 工具類,自己整理的一些游戲開發(fā)可能用到的模塊,單獨(dú)獨(dú)立使用,方便游戲開發(fā)。 本節(jié)介紹,這里在使用微軟的Azure 進(jìn)行語音合成的兩個(gè)方

    2024年02月12日
    瀏覽(23)
  • 瀏覽器原生JavaScript離線文字轉(zhuǎn)語音TTS播放,支持Windows自帶TTS語音和移動(dòng)端(安卓、IOS)

    瀏覽器原生JavaScript離線文字轉(zhuǎn)語音TTS播放,支持Windows自帶TTS語音和移動(dòng)端(安卓、IOS)

    JS已經(jīng)可以實(shí)現(xiàn)語音合成(文字轉(zhuǎn)語音)和語音識(shí)別(語音轉(zhuǎn)文字),各個(gè)瀏覽器支持列表如下所示: 語音識(shí)別支持列表: 因此,瀏覽器上面使用語音合成非常簡單。 頁面效果示例: 1、支持速度,音調(diào)設(shè)置 2、支持下拉選擇語音模板 3、文字轉(zhuǎn)語音 該文件可直接保存成htm

    2024年02月04日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包