国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)(部署+運(yùn)行)

這篇具有很好參考價(jià)值的文章主要介紹了學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)(部署+運(yùn)行)。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1、Whisper內(nèi)容簡單介紹

OpenAI的語音識別模型Whisper,Whisper 是一個(gè)自動(dòng)語音識別(ASR,Automatic Speech Recognition)系統(tǒng),OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時(shí)的多語言(98 種語言)和多任務(wù)(multitask)監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個(gè)龐大而多樣的數(shù)據(jù)集,可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除了可以用于語音識別,Whisper 還能實(shí)現(xiàn)多種語言的轉(zhuǎn)錄,以及將這些語言翻譯成英語。Open AI 強(qiáng)調(diào) Whisper 的語音識別能力已達(dá)到人類水準(zhǔn)。

學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)(部署+運(yùn)行)
左:輸入的音頻被分割成 30 秒的小段、轉(zhuǎn)換為 log-Mel 頻譜圖,然后傳遞到編碼器。

右:解碼器經(jīng)過訓(xùn)練以預(yù)測相應(yīng)的文字說明,并與特殊的標(biāo)記進(jìn)行混合,這些標(biāo)記指導(dǎo)單一模型執(zhí)行諸如語言識別、短語級別的時(shí)間戳、多語言語音轉(zhuǎn)錄和語音翻譯等任務(wù)。

2、Whisper模型實(shí)戰(zhàn)

Whisper模型GitHub代碼地址
部署步驟如下:(注意使用的是Windows系統(tǒng))

# 新建chatglm環(huán)境
conda create -n whisper python==3.8
# 激活chatglm環(huán)境
conda activate chatglm
# 安裝PyTorch環(huán)境
pip --trusted-host pypi.tuna.tsinghua.edu.cn install torch==1.10.1+cu102 torchvision==0.11.2+cu102 torchaudio==0.10.1 -f https://download.pytorch.org/whl/torch_stable.html
# 一鍵安裝依賴包
pip install -U openai-whisper
#執(zhí)行tiny demo
whisper D:/11.mp4 --model tiny  --language Chinese

model tiny運(yùn)行結(jié)果
學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)(部署+運(yùn)行)
model base運(yùn)行結(jié)果
學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)(部署+運(yùn)行)
可以看出base model識別效果還是挺不錯(cuò)的,但由于追求速度,某些音相近的會(huì)被識別錯(cuò)誤。
例如:
應(yīng)供–因公
乘凱–陳凱
試驗(yàn)–誓言
逛該意目–灌溉億畝文章來源地址http://www.zghlxwxcb.cn/news/detail-460246.html

到了這里,關(guān)于學(xué)習(xí)實(shí)踐-Whisper語音識別模型實(shí)戰(zhàn)(部署+運(yùn)行)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • whisper實(shí)踐--基于whisper+pyqt5開發(fā)的語音識別翻譯生成字幕工具

    whisper實(shí)踐--基于whisper+pyqt5開發(fā)的語音識別翻譯生成字幕工具

    大家新年快樂,事業(yè)生活蒸蒸日上,解封的第一個(gè)年,想必大家都回家過年,好好陪陪家人了吧,這篇文章也是我在老家碼的,還記得上篇我?guī)Т蠹一玖私饬藈hisper,相信大家對whisper是什么,怎么安裝whisper,以及使用都有了一個(gè)認(rèn)識,這次作為新年第一篇文章,我將介紹一

    2024年02月01日
    瀏覽(27)
  • Whisper 語音識別模型

    Whisper 語音識別模型 Whisper 是一種通用的語音識別模型。它是在包含各種音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個(gè)可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。 開源項(xiàng)目地址:https://github.com/openai/whisper Whisper 語音識別模型 Transformer 序列到序列模型針對各種語音

    2024年02月16日
    瀏覽(25)
  • Whisper JAX 語音識別本地部署

    https://nlpcloud.com/zh/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html whisper-jax最詳細(xì)的安裝教程 | 一個(gè)號稱比whisper快70倍的語音識別項(xiàng)目 | 免費(fèi)開源的語音識別項(xiàng)目 whisperX 語音識別本地部署_JoeManba的博客-CSDN博客 GitHub - sanchit-gandhi/whisper-jax: JAX implement

    2024年02月08日
    瀏覽(21)
  • OpenAI Whisper 語音識別 API 模型使用 | python 語音識別

    OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外,又推出了一個(gè) Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后,把需要翻譯的音頻目錄放進(jìn)去,運(yùn)行程序即可生成音頻對應(yīng)的文字。 以上。

    2024年02月16日
    瀏覽(93)
  • Whisper OpenAI開源語音識別模型

    Whisper 是一個(gè)自動(dòng)語音識別(ASR,Automatic Speech Recognition)系統(tǒng),OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時(shí)的多語言(98 種語言)和多任務(wù)(multitask)監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個(gè)龐大而多樣的數(shù)據(jù)集,可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除

    2024年02月16日
    瀏覽(96)
  • 語音識別模型whisper的參數(shù)說明

    語音識別模型whisper的參數(shù)說明

    一、whisper簡介: Whisper是一種通用的語音識別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個(gè)多任務(wù)模型,可以執(zhí)行多語言語音識別、語音翻譯和語言識別。 二、whisper的參數(shù) 1、-h, --help 查看whisper的參數(shù) 2、--model {tiny.en,tiny,base.en,base,small.en,small,medium.en,medium,large-v1

    2024年02月12日
    瀏覽(19)
  • 本地部署_語音識別工具_(dá)Whisper

    1 簡介 Whisper 是 OpenAI 的語音識別系統(tǒng)(幾乎是最先進(jìn)),它是免費(fèi)的開源模型,可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice 3 github https://github.com/ahmetoner/whisper-asr-webservice 4 運(yùn)行 image 大?。?1.5G 運(yùn)行后,即可在9000端口通過swagger調(diào)用,我先用手機(jī)錄

    2024年02月05日
    瀏覽(24)
  • whisper語音識別部署及WER評價(jià)

    whisper語音識別部署及WER評價(jià)

    1.whisper部署 詳細(xì)過程可以參照:?? 創(chuàng)建項(xiàng)目文件夾 conda創(chuàng)建虛擬環(huán)境 安裝pytorch 下載whisper 安裝相關(guān)包 測試一下whispet是否安裝成功(默認(rèn)識別為中文) whisper識別中文的時(shí)候經(jīng)常會(huì)輸出繁體,加入一下參數(shù)可以避免: 2.腳本批量測試 創(chuàng)建test.sh腳本,輸入一下內(nèi)容,可以實(shí)

    2024年02月10日
    瀏覽(23)
  • 自動(dòng)語音識別模型whisper安裝和初探

    自動(dòng)語音識別模型whisper安裝和初探

    whisper是OpenAI 最近發(fā)布的語音識別模型。OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時(shí)的多語言(98 種語言)和多任務(wù)(multitask)監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練,whisper可以執(zhí)行多語言語音識別、語音翻譯和語言識別。 1.CMD命令窗口建立名為whisper的虛擬環(huán)境: 注意:whisper要求python版本

    2023年04月18日
    瀏覽(43)
  • OpenAI-whisper語音識別模型

    OpenAI-whisper語音識別模型

    Whisper是一個(gè)通用的語音識別模型。它是在不同音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個(gè)多任務(wù)模型,可以執(zhí)行多語言語音識別、語音翻譯和語言識別。 whisper有五種模型尺寸,提供速度和準(zhǔn)確性的平衡,其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求

    2024年02月09日
    瀏覽(100)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包