国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python使用PaddleSpeech實現(xiàn)語音識別(ASR)、語音合成(TTS)

這篇具有很好參考價值的文章主要介紹了Python使用PaddleSpeech實現(xiàn)語音識別(ASR)、語音合成(TTS)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

目錄

安裝

語音識別

補全標點

語音合成

參考


PaddleSpeech是百度飛槳開發(fā)的語音工具

安裝

注意,PaddleSpeech不支持過高版本的Python,因為在高版本的Python中,飛槳不再提供paddle.fluid API。這里面我用的是Python3.7

需要通過3個pip命令安裝PaddleSpeech:

pip install paddlepaddle==2.4.2
pip install pytest-runner
pip install paddlespeech

在使用的時候,urllib3庫可能會報錯,因此需要對它進行降級:

pip uninstall urllib3
pip install urllib3==1.26.18

語音識別

PaddleSpeech的語音識別非常簡單:

from paddlespeech.cli.asr.infer import ASRExecutor
asr = ASRExecutor()
result = asr(audio_file="zh.wav")
print(result)

輸出:

我們說四十二號混凝土不能與引力場相互攪拌不然會因為愛因斯坦的相對論而引發(fā)炸串的食品安全問題這是嚴重的金融危機

可以看到,這里面沒有標點符號。我們可以通過TextExecutor()補全標點

補全標點

在補全標點之前,需要在C:\Users\<你的用戶名>\AppData\Roaming下創(chuàng)建一個nltk_data文件夾,然后將這個鏈接里面的文件夾都復制進去:

項目目錄預覽 - nltk_data - GitCode

paddlespeech 合成,python,語音識別,開發(fā)語言

?接下來從tokenizers文件夾下找到punkt.zip文件,然后將這個zip文件里的punkt文件夾復制到nltk_data文件夾里。

paddlespeech 合成,python,語音識別,開發(fā)語言

?這樣我們就做好了補全標點前的準備。

補全標點也很簡單,它的基礎用法如下:

from paddlespeech.cli.text.infer import TextExecutor
text_punc = TextExecutor()
result = text_punc(text=u"今天的天氣真不錯啊你下午有空嗎我想約你一起去吃飯")
print(result)

輸出:

今天的天氣真不錯啊!你下午有空嗎?我想約你一起去吃飯。

?我們可以將補全標點和語音識別結合起來:

from paddlespeech.cli.asr.infer import ASRExecutor
from paddlespeech.cli.text.infer import TextExecutor
text_punc = TextExecutor()
asr = ASRExecutor()
asr_result = asr(audio_file="zh.wav")
result = text_punc(text=asr_result)
print(result)

?輸出:

我們說,四十二號混凝土不能與引力場相互攪拌,不然,會因為愛因斯坦的相對論,而引發(fā)炸串的食品安全問題,這是嚴重的金融危機。

語音合成

語音合成可以使用TTSExecutor:

from paddlespeech.cli.tts.infer import TTSExecutor
tts = TTSExecutor()
tts(text="今天天氣十分不錯。", output="output.wav")

最后會在當前目錄下生成一個output.wav音頻?

參考

PaddleSpeech: Easy-to-use Speech Toolkit including SOTA ASR pipeline, influential TTS with text frontend and End-to-End Speech Simultaneous Translation. (gitee.com)

[TTS]我運行語音專文本的示例代碼報錯 · Issue #3488 · PaddlePaddle/PaddleSpeech · GitHub?

nltk包下載慢的解決方案(總結)_nltk download太慢-CSDN博客?文章來源地址http://www.zghlxwxcb.cn/news/detail-857253.html

到了這里,關于Python使用PaddleSpeech實現(xiàn)語音識別(ASR)、語音合成(TTS)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 百度飛槳paddlespeech實現(xiàn)小程序?qū)崟r語音流識別

    百度飛槳paddlespeech實現(xiàn)小程序?qū)崟r語音流識別

    前言: 哈哈,這是我2023年4月份的公司作業(yè)。如果僅僅是簡單的語音識別倒也沒什么難度,wav文件直接走模型輸出結果的事??墒亲⒁鈽祟},流式識別、實時! 那么不得不說一下流式的優(yōu)點了。 1、解決內(nèi)存溢出的煩惱。 2、打算做成無文件生成,接收語音流直接走模型,減

    2023年04月21日
    瀏覽(31)
  • 人工智能-語音識別技術paddlespeech的搭建和使用

    PaddleSpeech是百度飛槳(PaddlePaddle)開源深度學習平臺的其中一個項目,它基于飛槳的語音方向模型庫,用于語音和音頻中的各種關鍵任務的開發(fā),包含大量基于深度學習前沿和有影響力的模型。PaddleSpeech支持語音識別、語音翻譯(英譯中)、語音合成、標點恢復等應用示例。

    2024年02月02日
    瀏覽(27)
  • 基于百度語音識別、文心一言大模型、百度語音合成的一套完整的語音交互(利用Python實現(xiàn))

    基于百度語音識別、文心一言大模型、百度語音合成的一套完整的語音交互(利用Python實現(xiàn))

    ? ? ? ?本人小白,因為畢設項目需要用的語音交互,便查網(wǎng)上的資料利用百度api實現(xiàn),比較簡單的過程,供大家借鑒批判。 項目框架大致分為3步:(1)百度語音識別可以將我們輸入的語音轉(zhuǎn)化為文本輸入到文心一言大模型;(2)文心一言大模型根據(jù)輸入以輸出響應文本;

    2024年04月17日
    瀏覽(23)
  • 小程序中使用微信同聲傳譯插件實現(xiàn)語音識別、語音合成、文本翻譯功能----文本翻譯(三)

    小程序中使用微信同聲傳譯插件實現(xiàn)語音識別、語音合成、文本翻譯功能----文本翻譯(三)

    官方文檔鏈接:https://mp.weixin.qq.com/wxopen/plugindevdoc?appid=wx069ba97219f66d99token=370941954lang=zh_CN#- 要使用插件需要先在小程序管理后臺的 設置-第三方設置-插件管理 中添加插件,目前該插件僅認證后的小程序。 文本翻譯目前支持的語言有 zh_CN(中國大陸) en_US(英語)。 參數(shù)說明:

    2024年01月18日
    瀏覽(99)
  • 樹莓派Linux實現(xiàn)ChatGPT語音交互(語音識別,TTS)

    樹莓派Linux實現(xiàn)ChatGPT語音交互(語音識別,TTS)

    ChatGPT使用想必大家都不陌生,進入官網(wǎng),注冊賬號即可開始正式的對話聊天,可是如何使用ChatGPT API,且在Linux環(huán)境下進行語音交互呢?碰巧在今年暑期參加物聯(lián)網(wǎng)設計競賽有用到這項功能,今天就來教下大家詳細步驟。 如何獲取一個ChatGPT賬號相比對大家來說不是一件難事,

    2024年02月08日
    瀏覽(18)
  • MS-TTS:免費微軟TTS語音合成工具(一鍵合成導出MP3音頻)

    MS-TTS:免費微軟TTS語音合成工具(一鍵合成導出MP3音頻)

    聲明 本工具是個免費工具,遇到問題,還請自行解決,下面有文字教程,B站有視頻教程(鏈接在文章末尾); 其次,微軟接口卡頓,連接超時等問題下方有詳細說明,請仔細看一下; 再次,強制升級是為了統(tǒng)一版本方便問題的收集與解決,如果你能理解最好,不能理解的話

    2024年02月03日
    瀏覽(54)
  • 離線語音交互技術路線之語音合成(TTS)篇

    離線語音交互技術路線之語音合成(TTS)篇

    ??在ChatGPT大行其道之際,我心血來潮想要研究研究如何實現(xiàn)離線語音交互,把它和ChatGPT相結合,自己嘗試實現(xiàn)個語音助手玩玩。本篇文章主要先從整體上分析了離線語音交互的技術實現(xiàn)路線,以及每個環(huán)節(jié)可能用到的參考技術,然后詳細闡述了其中一個環(huán)節(jié):語音合成(

    2024年02月09日
    瀏覽(22)
  • 【語音合成】微軟 edge-tts

    目錄 1.?edge-tts 介紹 2. 代碼示例 https://github.com/rany2/edge-tts 在Python代碼中使用Microsoft Edge的在線文本到語音服務

    2024年02月14日
    瀏覽(23)
  • 微軟語音合成(tts)服務申請和調(diào)用

    微軟語音合成(tts)服務申請和調(diào)用

    https://azure.microsoft.com/zh-cn/free/ 這里有個視頻教程,根據(jù)此完成申請流程: https://www.bilibili.com/video/BV15a4y1W7re?vd_source=bf07f28d37849885d215dc3aea189eba 申請完成后,就可以到這里申請資源: https://portal.azure.com/#home 點擊資源組,里面就有部署好的服務了 點擊這里,可以獲取 subscription

    2024年02月11日
    瀏覽(28)
  • 語音合成工具Coqui TTS安裝及體驗

    語音合成工具Coqui TTS安裝及體驗

    先介紹兩種免費的語音合成工具 官網(wǎng) http://balabolka.site/balabolka.htm 是一種基于微軟Speech API (SAPI)的免費語音合成工具,只是簡單的發(fā)音合成,效果比較生硬 官網(wǎng) https://coqui.ai/ 是基于深度學習的語音合成軟件,效果較好 Windows下安裝Coqui TTS 安裝環(huán)境 要求python運行環(huán)境:https://

    2024年02月15日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包