国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

語音識別whisper的介紹、安裝、錯誤記錄

這篇具有很好參考價值的文章主要介紹了語音識別whisper的介紹、安裝、錯誤記錄。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

介紹

Whisper是OpenAI于2022年9月份開源的通用的語音識別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的模型,也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。
論文鏈接:https://arxiv.org/abs/2212.04356
github鏈接:https://github.com/openai/whisper

安裝

Whisper主要是基于Pytorch實現(xiàn),所以需要在安裝有pytorch的環(huán)境中使用。

1、安裝Whisper

pip install -U openai-whisper

或者

pip install git+https://github.com/openai/whisper.git

安裝好之后,打開cmd界面,執(zhí)行whisper,出現(xiàn)如下提示說明安裝成功
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

2、安裝FFmpeg

FFmpeg是一款音視頻編解碼工具。Whisper需要使用FFmpeg工具提取聲音數(shù)據(jù),所以需要安裝配置FFmpeg。
參考博客:https://blog.csdn.net/weixin_45487348/article/details/130722161
安裝好之后,,打開cmd界面,執(zhí)行ffmpeg,出現(xiàn)如下提示說明安裝成功
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

3、安裝Rust

網(wǎng)上很多步驟說,需要安裝Rust,用于實現(xiàn)快速分詞,因為我暫時沒用到這個,所以大家按需下載~

pip install setuptools-rust

使用

命令行方式

# 幫助信息
whisper --help

# 根據(jù)官網(wǎng)使用教程可以有以下常用方式
whisper music.mp3 --model tiny --language Chinese --device cuda:0 --initial_prompt "以下是普通話的句子"

語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

Python代碼

import whisper
model = whisper.load_model("base", "cpu")
mps_path = r"music.mp3"
result = model.transcribe(mps_path, fp16=False, language='Chinese')
print(result["text"])

說明:如果你的機器有GPU,那這里的**“fp16=False”**不是必須的。因為筆者本地測試機器沒有GPU,只用用CPU進行測試,所以這里我設(shè)置了這個參數(shù)。

whisper模型

語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

報錯信息

以下是筆者調(diào)試過程中遇到的錯誤記錄:

Error 1

FileNotFoundError: [WinError 2] 系統(tǒng)找不到指定的文件。

解決辦法:
找到External Libraries —> Python 3.8 —> Libs —> subprocess.py —> Ctrl+F 查找“class POpen” ,將shell=False,改為 shell=True。
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能
參考鏈接:https://blog.csdn.net/qq_24118527/article/details/90579328

Error 2

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 9: invalid start byte

解決辦法:
這個問題表面上就是ffmpeg造成的,好像在讀取文件的時候某個位置的編碼有問題。實際上是由于上面的代碼修改后,需要重新啟動(在windows系統(tǒng)有這個問題)。
如果重新啟動之后,還是出現(xiàn)上述錯誤,可以按照如下方式重新設(shè)置:Pycharm setting —> Tools —> Terminal —> 找到 shell path,將其修改為本地cmd。
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能文章來源地址http://www.zghlxwxcb.cn/news/detail-715783.html

到了這里,關(guān)于語音識別whisper的介紹、安裝、錯誤記錄的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 如何在矩池云上安裝語音識別模型 Whisper

    如何在矩池云上安裝語音識別模型 Whisper

    Whisper 是 OpenAI 近期開源的一個語音識別的模型,研究人員基于 680,000 小時的標(biāo)記音頻數(shù)據(jù)進行訓(xùn)練,它同時也是一個多任務(wù)模型,可以進行多語言語音識別以及語音翻譯任務(wù),可以將語音音頻轉(zhuǎn)錄為所講語言的文本,以及翻譯成英語文本。 查看論文:https://cdn.openai.com/paper

    2024年02月11日
    瀏覽(19)
  • ubuntu16.04安裝語音識別whisper及whisper-ctranslate2工具(填坑篇)

    環(huán)境: 系統(tǒng)ubuntu16.04,顯卡是NVIDIA ?Quadro RTX5000 目標(biāo): 安裝語音識別工具whipser/whipser-ctranslate2 ????????因之前有過幾次在linux和windows上有過部署whisper經(jīng)驗和使用經(jīng)驗,其中有使用GPU的,有CPU的,各自語音識別效率一言難盡,建議直接裝whipser-ctranslate2。同時,感謝B站博主

    2024年02月04日
    瀏覽(23)
  • OpenAI開源語音識別模型Whisper在Windows系統(tǒng)的安裝詳細過程

    OpenAI開源語音識別模型Whisper在Windows系統(tǒng)的安裝詳細過程

    Python的安裝很簡單,點擊這里進行下載。 安裝完成之后,輸入python -V可以看到版本信息,說明已經(jīng)安裝成功了。 如果輸入python -V命令沒有看到上面的這樣的信息,要么是安裝失敗,要么是安裝好之后沒有自動配置環(huán)境變量,如何配置環(huán)境變量可以從網(wǎng)上搜索。 Python的具體安

    2024年02月08日
    瀏覽(90)
  • 如何一鍵生成字幕,如何快速處理生肉資源?借助whisper語音識別系統(tǒng)生成.srt字幕文件 手把手教學(xué)在Windows、CPU版本下whisper的安裝與使用,快速上手!

    如何一鍵生成字幕,如何快速處理生肉資源?借助whisper語音識別系統(tǒng)生成.srt字幕文件 手把手教學(xué)在Windows、CPU版本下whisper的安裝與使用,快速上手!

    Whisper是Open AI開源的語音識別網(wǎng)絡(luò),支持98中語言,用于語音識別和翻譯等任務(wù)。我們可以將歌曲的歌詞進行識別,將無字幕的視頻資源自動生成字母,極大方便了用戶。同時,whisper可以在本地運行,充分保障了個人隱私。在識別方面也具有較準(zhǔn)確的識別能力。 因此想通過本

    2024年02月02日
    瀏覽(55)
  • OpenAI Whisper 語音識別 API 模型使用 | python 語音識別

    OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外,又推出了一個 Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后,把需要翻譯的音頻目錄放進去,運行程序即可生成音頻對應(yīng)的文字。 以上。

    2024年02月16日
    瀏覽(93)
  • 語音識別whisper

    Whisper是一個通用的語音識別模型,它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練,能夠在英語語音識別上達到接近人類水平的魯棒性和準(zhǔn)確性1。Whisper還可以進行多語言語音識別、語音翻譯和語言識別等任務(wù)2。Whisper的架構(gòu)是一個簡單的端到端方法,采用了編碼器-解碼器

    2024年02月12日
    瀏覽(19)
  • 語音識別 - ASR whisper

    語音識別 - ASR whisper

    目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用

    2024年02月12日
    瀏覽(22)
  • Whisper 語音識別模型

    Whisper 語音識別模型 Whisper 是一種通用的語音識別模型。它是在包含各種音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。 開源項目地址:https://github.com/openai/whisper Whisper 語音識別模型 Transformer 序列到序列模型針對各種語音

    2024年02月16日
    瀏覽(25)
  • python語音識別whisper

    python語音識別whisper

    一、背景 最近想提取一些視頻的字幕,語音文案,研究了一波 二、whisper語音識別 Whisper 是一種通用的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓(xùn)練,也是一個多任務(wù)模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。 stable-ts在 OpenAI 的 Whisper 之上修改并添加

    2024年02月05日
    瀏覽(86)
  • 【語音識別】OpenAI whisper

    【語音識別】OpenAI whisper

    目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用

    2024年02月13日
    瀏覽(90)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包