国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<tfoot id="k3yst"></tfoot>

<span id="k3yst"><meter id="k3yst"></meter></span>

學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)（部署+運(yùn)行）

2年前作者：李卓璐分類：Toy博客閱讀(26)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)（部署+運(yùn)行）。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1、Whisper內(nèi)容簡單介紹

OpenAI的語音識別模型Whisper，Whisper 是一個(gè)自動(dòng)語音識別（ASR，Automatic Speech Recognition）系統(tǒng)，OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時(shí)的多語言（98 種語言）和多任務(wù)（multitask）監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個(gè)龐大而多樣的數(shù)據(jù)集，可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除了可以用于語音識別，Whisper 還能實(shí)現(xiàn)多種語言的轉(zhuǎn)錄，以及將這些語言翻譯成英語。Open AI 強(qiáng)調(diào) Whisper 的語音識別能力已達(dá)到人類水準(zhǔn)。

學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)（部署+運(yùn)行）
左：輸入的音頻被分割成 30 秒的小段、轉(zhuǎn)換為 log-Mel 頻譜圖，然后傳遞到編碼器。

右：解碼器經(jīng)過訓(xùn)練以預(yù)測相應(yīng)的文字說明，并與特殊的標(biāo)記進(jìn)行混合，這些標(biāo)記指導(dǎo)單一模型執(zhí)行諸如語言識別、短語級別的時(shí)間戳、多語言語音轉(zhuǎn)錄和語音翻譯等任務(wù)。

2、Whisper模型實(shí)戰(zhàn)

Whisper模型GitHub代碼地址
部署步驟如下：（注意使用的是Windows系統(tǒng))

# 新建chatglm環(huán)境
conda create -n whisper python==3.8
# 激活chatglm環(huán)境
conda activate chatglm
# 安裝PyTorch環(huán)境
pip --trusted-host pypi.tuna.tsinghua.edu.cn install torch==1.10.1+cu102 torchvision==0.11.2+cu102 torchaudio==0.10.1 -f https://download.pytorch.org/whl/torch_stable.html
# 一鍵安裝依賴包
pip install -U openai-whisper
#執(zhí)行tiny demo
whisper D:/11.mp4 --model tiny  --language Chinese

model tiny運(yùn)行結(jié)果
學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)（部署+運(yùn)行）
model base運(yùn)行結(jié)果

可以看出base model識別效果還是挺不錯(cuò)的，但由于追求速度，某些音相近的會(huì)被識別錯(cuò)誤。
例如：
應(yīng)供–因公
乘凱–陳凱
試驗(yàn)–誓言
逛該意目–灌溉億畝文章來源地址http://www.zghlxwxcb.cn/news/detail-460246.html

到了這里，關(guān)于學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)（部署+運(yùn)行）的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

whisper實(shí)踐--基于whisper+pyqt5開發(fā)的語音識別翻譯生成字幕工具
大家新年快樂，事業(yè)生活蒸蒸日上，解封的第一個(gè)年，想必大家都回家過年，好好陪陪家人了吧，這篇文章也是我在老家碼的，還記得上篇我?guī)Т蠹一玖私饬藈hisper，相信大家對whisper是什么，怎么安裝whisper，以及使用都有了一個(gè)認(rèn)識，這次作為新年第一篇文章，我將介紹一
2024年02月01日
瀏覽(27)
Whisper 語音識別模型
Whisper 語音識別模型 Whisper 是一種通用的語音識別模型。它是在包含各種音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個(gè)可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。開源項(xiàng)目地址：https://github.com/openai/whisper Whisper 語音識別模型 Transformer 序列到序列模型針對各種語音
2024年02月16日
瀏覽(25)
Whisper JAX 語音識別本地部署
https://nlpcloud.com/zh/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html whisper-jax最詳細(xì)的安裝教程 | 一個(gè)號稱比whisper快70倍的語音識別項(xiàng)目 | 免費(fèi)開源的語音識別項(xiàng)目 whisperX 語音識別本地部署_JoeManba的博客-CSDN博客 GitHub - sanchit-gandhi/whisper-jax: JAX implement
2024年02月08日
瀏覽(21)
OpenAI Whisper 語音識別 API 模型使用 | python 語音識別
OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一個(gè) Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后，把需要翻譯的音頻目錄放進(jìn)去，運(yùn)行程序即可生成音頻對應(yīng)的文字。以上。
2024年02月16日
瀏覽(93)
Whisper OpenAI開源語音識別模型
Whisper 是一個(gè)自動(dòng)語音識別（ASR，Automatic Speech Recognition）系統(tǒng)，OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時(shí)的多語言（98 種語言）和多任務(wù)（multitask）監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個(gè)龐大而多樣的數(shù)據(jù)集，可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除
2024年02月16日
瀏覽(96)
語音識別模型whisper的參數(shù)說明
一、whisper簡介： Whisper是一種通用的語音識別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個(gè)多任務(wù)模型，可以執(zhí)行多語言語音識別、語音翻譯和語言識別。二、whisper的參數(shù) 1、-h, --help 查看whisper的參數(shù) 2、--model {tiny.en,tiny,base.en,base,small.en,small,medium.en,medium,large-v1
2024年02月12日
瀏覽(19)
本地部署_語音識別工具_(dá)Whisper
1 簡介 Whisper 是 OpenAI 的語音識別系統(tǒng)（幾乎是最先進(jìn)），它是免費(fèi)的開源模型，可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice 3 github https://github.com/ahmetoner/whisper-asr-webservice 4 運(yùn)行 image 大?。?1.5G 運(yùn)行后，即可在9000端口通過swagger調(diào)用，我先用手機(jī)錄
2024年02月05日
瀏覽(24)
whisper語音識別部署及WER評價(jià)
1.whisper部署詳細(xì)過程可以參照：?? 創(chuàng)建項(xiàng)目文件夾 conda創(chuàng)建虛擬環(huán)境安裝pytorch 下載whisper 安裝相關(guān)包測試一下whispet是否安裝成功（默認(rèn)識別為中文） whisper識別中文的時(shí)候經(jīng)常會(huì)輸出繁體，加入一下參數(shù)可以避免： 2.腳本批量測試創(chuàng)建test.sh腳本，輸入一下內(nèi)容，可以實(shí)
2024年02月10日
瀏覽(23)
自動(dòng)語音識別模型whisper安裝和初探
whisper是OpenAI 最近發(fā)布的語音識別模型。OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時(shí)的多語言（98 種語言）和多任務(wù)（multitask）監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練，whisper可以執(zhí)行多語言語音識別、語音翻譯和語言識別。 1.CMD命令窗口建立名為whisper的虛擬環(huán)境：注意：whisper要求python版本
2023年04月18日
瀏覽(43)
OpenAI-whisper語音識別模型
Whisper是一個(gè)通用的語音識別模型。它是在不同音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個(gè)多任務(wù)模型，可以執(zhí)行多語言語音識別、語音翻譯和語言識別。 whisper有五種模型尺寸，提供速度和準(zhǔn)確性的平衡，其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求
2024年02月09日
瀏覽(100)

<rp id="hjlik"><u id="hjlik"></u></rp>