国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<delect id="ijicl"></delect>

人工智能-語音識別技術(shù)paddlespeech的搭建和使用

2年前作者：沒刮胡子分類：Toy博客閱讀(28)違法舉報

這篇具有很好參考價值的文章主要介紹了人工智能-語音識別技術(shù)paddlespeech的搭建和使用。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

PaddleSpeech 介紹

PaddleSpeech是百度飛槳（PaddlePaddle）開源深度學(xué)習(xí)平臺的其中一個項目，它基于飛槳的語音方向模型庫，用于語音和音頻中的各種關(guān)鍵任務(wù)的開發(fā)，包含大量基于深度學(xué)習(xí)前沿和有影響力的模型。PaddleSpeech支持語音識別、語音翻譯（英譯中）、語音合成、標(biāo)點恢復(fù)等應(yīng)用示例。

安裝paddlespeech

PaddleSpeech 快速安裝方式有兩種，一種是 pip 安裝，一種是源碼編譯（官方推薦）。

使用pip安裝paddlespeech

$ pip install pytest-runner
$ pip3 install paddleaudio==1.0.1
$ pip3 install paddlespeech==1.0.1

使用源碼編譯安裝

$ git clone https://github.com/PaddlePaddle/PaddleSpeech.git
$ cd PaddleSpeech
$ pip install pytest-runner
$ pip install .

提示：安裝過程可能因為缺少各種的庫報錯，如：librosa 依賴的系統(tǒng)庫，gcc 環(huán)境問題，kaldi 安裝等可以在網(wǎng)上查找。

音頻示例下載

$ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav
$ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav

基本使用

語音合成

 $ paddlespeech tts --input "你好，歡迎使用百度飛槳深度學(xué)習(xí)框架！" --output output.wav
 $ paddlespeech tts --input "你好稅軟" --output sr.wav

如果報錯

$ pip install numpy==1.23.0
$ sudo apt-get install libsndfile1

執(zhí)行過程

$  ts-paddle /paddle/PaddleSpeech paddlespeech tts --input "你好，歡迎使用百度飛槳深度學(xué)習(xí)框架！" --output output.wav
grep: warning: GREP_OPTIONS is deprecated; please use an alias or script
/usr/local/lib/python3.7/dist-packages/librosa/core/constantq.py:1059: DeprecationWarning: `np.complex` is a deprecated alias for the builtin `complex`. To silence this warning, use `complex` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.complex128` here.
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  dtype=np.complex,
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 489M/489M [01:01<00:00, 7.96MB/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 915M/915M [01:51<00:00, 8.22MB/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 589M/589M [01:01<00:00, 9.57MB/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 107k/107k [00:00<00:00, 1.33MB/s]
W0606 13:22:41.408085  2451 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 7.5, Driver API Version: 11.7, Runtime API Version: 11.7
W0606 13:22:41.412684  2451 gpu_resources.cc:91] device: 0, cuDNN Version: 8.4.
/paddle/PaddleSpeech/output.wavλ ts-paddle /paddle/PaddleSpeech ls

語音識別

識別中文

$ paddlespeech asr --lang zh --input zh.wav

指定模型識別，識別英文

$ paddlespeech  asr --lang en --model deepspeech2offline_librispeech  --input en.wav

標(biāo)點恢復(fù)

恢復(fù)文本標(biāo)點，可與ASR模型配合使用

$ paddlespeech text --task punc --input 今天的天氣真不錯啊你下午有空嗎我想約你一起去吃飯

聲音分類

適配多場景的開放領(lǐng)域聲音分類工具
基于 AudioSet 數(shù)據(jù)集 527 個類別的聲音分類模型

$ paddlespeech cls --input zh.wav

聲紋提取

工業(yè)級聲紋提取工具

$ paddlespeech vector --task spk --input zh.wav

語音翻譯

端到端英譯中語音翻譯工具,使用預(yù)編譯的 kaldi 相關(guān)工具，只支持在 Ubuntu 系統(tǒng)中體驗文章來源地址http://www.zghlxwxcb.cn/news/detail-784056.html

$ paddlespeech st --input en.wav

到了這里，關(guān)于人工智能-語音識別技術(shù)paddlespeech的搭建和使用的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

語音識別與VC維：改變?nèi)斯ぶ悄艿奈磥?/a>
語音識別(Speech Recognition)是一種人工智能技術(shù)，它旨在將人類的語音信號轉(zhuǎn)換為文本或其他形式的數(shù)據(jù)。這項技術(shù)在過去幾年中得到了巨大的發(fā)展，并成為人工智能領(lǐng)域的一個關(guān)鍵技術(shù)。VC維(Vocabulary Coverage Dimension)是一種數(shù)學(xué)模型，用于描述語言模型的表達(dá)能力。在本文中，
2024年02月19日
瀏覽(25)
【人工智能】科大訊飛語音識別應(yīng)用開發(fā)（第三集）
這次需要對科大訊飛語音識別接口進(jìn)行語音識別應(yīng)用開發(fā)，前兩次都是通過WebAPI調(diào)用接口，這次換一下，通過SDK調(diào)用接口下面是開發(fā)的詳細(xì)記錄過程（基于前兩次的基礎(chǔ)上）網(wǎng)址：https://www.xfyun.cn/services/voicedictation 不領(lǐng)服務(wù)量為500且該包免費(fèi)（貌似是不同應(yīng)用都可以免費(fèi)領(lǐng)
2024年02月13日
瀏覽(22)
OpenAI的人工智能語音識別模型Whisper詳解及使用
????????擁有ChatGPT語言模型的OpenAI公司，開源了 Whisper 自動語音識別系統(tǒng)，OpenAI 強(qiáng)調(diào) Whisper 的語音識別能力已達(dá)到人類水準(zhǔn)。 ????????Whisper是一個通用的語音識別模型，它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練，能夠在英語語音識別上達(dá)到接近人類水平的魯
2024年02月09日
瀏覽(95)
構(gòu)建基于AWSLambda的人工智能應(yīng)用：語音識別、圖像識別和自然語言處理
作者：禪與計算機(jī)程序設(shè)計藝術(shù) 在人工智能領(lǐng)域，用大數(shù)據(jù)、機(jī)器學(xué)習(xí)等方法來解決復(fù)雜的問題，已經(jīng)成為越來越多企業(yè)和開發(fā)者關(guān)注的問題。但是，如何把這些方法落地到生產(chǎn)環(huán)境中，仍然是一個難題。隨著云計算平臺的廣泛普及，AWS Lambda作為一項服務(wù)正在成為各個公司
2024年02月09日
瀏覽(36)
人工智能語音交互技術(shù)在智能出行中的應(yīng)用
作者：禪與計算機(jī)程序設(shè)計藝術(shù) 智能出行是未來出行的趨勢，而人工智能語音交互技術(shù)將是智能出行的重要組成部分。人工智能語音交互技術(shù)，可以使得智能出行更加便捷、安全、智能化。本文將介紹人工智能語音交互技術(shù)在智能出行中的應(yīng)用。本文旨在介紹人工智能語音
2024年02月07日
瀏覽(98)
【飛槳PaddleSpeech語音技術(shù)課程】— 語音識別-Deepspeech2
(以下內(nèi)容搬運(yùn)自飛槳PaddleSpeech語音技術(shù)課程，點擊鏈接可直接運(yùn)行源碼) Demo實現(xiàn)：https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/demos/automatic_video_subtitiles/ 語音識別(Automatic Speech Recognition, ASR) 是一項從一段音頻中提取出語言文字內(nèi)容的任務(wù)。 (出處：DLHLP 李宏毅語音識別課程
2024年02月08日
瀏覽(25)
極速進(jìn)化,光速轉(zhuǎn)錄,C++版本人工智能實時語音轉(zhuǎn)文字(字幕/語音識別)Whisper.cpp實踐
業(yè)界良心OpenAI開源的Whisper模型是開源語音轉(zhuǎn)文字領(lǐng)域的執(zhí)牛耳者，白璧微瑕之處在于無法通過蘋果M芯片優(yōu)化轉(zhuǎn)錄效率，Whisper.cpp 則是 Whisper 模型的 C/C++ 移植版本，它具有無依賴項、內(nèi)存使用量低等特點，重要的是增加了 Core ML 支持，完美適配蘋果M系列芯片。 Whisper.cpp的張量
2024年02月02日
瀏覽(29)
人工智能技術(shù)在智能語音助手中的應(yīng)用：從智能家居到智慧交通
作者：禪與計算機(jī)程序設(shè)計藝術(shù) 引言 1.1. 背景介紹隨著科技的發(fā)展，人工智能技術(shù)越來越受到人們的關(guān)注。人工智能助手作為一種新型的技術(shù)，已經(jīng)成為人們生活中不可或缺的一部分。智能語音助手作為人工智能助手的一種，受到越來越多的用戶青睞。智能語音助手可以實
2024年02月07日
瀏覽(96)
【實踐探索】人工智能語音轉(zhuǎn)換技術(shù)的實踐經(jīng)驗和優(yōu)化建議
[toc] 【實踐探索】人工智能語音轉(zhuǎn)換技術(shù)的實踐經(jīng)驗和優(yōu)化建議隨著人工智能技術(shù)的快速發(fā)展，語音識別技術(shù)作為其基礎(chǔ)應(yīng)用之一，也得到了越來越廣泛的應(yīng)用。針對目前市場上主流的人工智能語音識別技術(shù)，本文將深入探討其原理、實現(xiàn)過程以及優(yōu)化建議。本文將重點分析
2024年02月06日
瀏覽(36)
【實用技巧】掌握人工智能語音轉(zhuǎn)換的核心技術(shù)，輕松實現(xiàn)多語言語音轉(zhuǎn)換和語音合成
作者：禪與計算機(jī)程序設(shè)計藝術(shù) 【實用技巧】掌握人工智能語音轉(zhuǎn)換的核心技術(shù)，輕松實現(xiàn)多語言語音轉(zhuǎn)換和語音合成 1.1. 背景介紹隨著全球化的加速，跨文化交流需求日益增長，多語言語音轉(zhuǎn)換和語音合成技術(shù)應(yīng)運(yùn)而生。人工智能技術(shù)的發(fā)展為語音合成和轉(zhuǎn)換提供了便利
2024年02月08日
瀏覽(381)

<ul id="bq6gk"></ul>