国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

語音識別whisper的介紹、安裝、錯誤記錄

2年前作者：可愛的小張同學(xué)分類：Toy博客閱讀(15)違法舉報

這篇具有很好參考價值的文章主要介紹了語音識別whisper的介紹、安裝、錯誤記錄。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

介紹

Whisper是OpenAI于2022年9月份開源的通用的語音識別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的模型，也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。
論文鏈接：https://arxiv.org/abs/2212.04356
github鏈接：https://github.com/openai/whisper

安裝

Whisper主要是基于Pytorch實現(xiàn)，所以需要在安裝有pytorch的環(huán)境中使用。

1、安裝Whisper

pip install -U openai-whisper

或者

pip install git+https://github.com/openai/whisper.git

安裝好之后，打開cmd界面，執(zhí)行whisper，出現(xiàn)如下提示說明安裝成功
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

2、安裝FFmpeg

FFmpeg是一款音視頻編解碼工具。Whisper需要使用FFmpeg工具提取聲音數(shù)據(jù)，所以需要安裝配置FFmpeg。
參考博客：https://blog.csdn.net/weixin_45487348/article/details/130722161
安裝好之后，，打開cmd界面，執(zhí)行ffmpeg，出現(xiàn)如下提示說明安裝成功
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

3、安裝Rust

網(wǎng)上很多步驟說，需要安裝Rust，用于實現(xiàn)快速分詞，因為我暫時沒用到這個，所以大家按需下載~

pip install setuptools-rust

使用

命令行方式

# 幫助信息
whisper --help

# 根據(jù)官網(wǎng)使用教程可以有以下常用方式
whisper music.mp3 --model tiny --language Chinese --device cuda:0 --initial_prompt "以下是普通話的句子"

語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

Python代碼

import whisper
model = whisper.load_model("base", "cpu")
mps_path = r"music.mp3"
result = model.transcribe(mps_path, fp16=False, language='Chinese')
print(result["text"])

說明：如果你的機器有GPU，那這里的**“fp16=False”**不是必須的。因為筆者本地測試機器沒有GPU，只用用CPU進行測試，所以這里我設(shè)置了這個參數(shù)。

whisper模型

語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能

報錯信息

以下是筆者調(diào)試過程中遇到的錯誤記錄：

Error 1

FileNotFoundError: [WinError 2] 系統(tǒng)找不到指定的文件。

解決辦法：
找到External Libraries —> Python 3.8 —> Libs —> subprocess.py —> Ctrl+F 查找“class POpen” ，將shell=False，改為 shell=True。
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能
參考鏈接：https://blog.csdn.net/qq_24118527/article/details/90579328

Error 2

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 9: invalid start byte

解決辦法：
這個問題表面上就是ffmpeg造成的，好像在讀取文件的時候某個位置的編碼有問題。實際上是由于上面的代碼修改后，需要重新啟動（在windows系統(tǒng)有這個問題）。
如果重新啟動之后，還是出現(xiàn)上述錯誤，可以按照如下方式重新設(shè)置：Pycharm setting —> Tools —> Terminal —> 找到 shell path，將其修改為本地cmd。
語音識別whisper的介紹、安裝、錯誤記錄,語音識別,whisper,人工智能文章來源地址http://www.zghlxwxcb.cn/news/detail-715783.html

到了這里，關(guān)于語音識別whisper的介紹、安裝、錯誤記錄的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

如何在矩池云上安裝語音識別模型 Whisper
Whisper 是 OpenAI 近期開源的一個語音識別的模型，研究人員基于 680,000 小時的標(biāo)記音頻數(shù)據(jù)進行訓(xùn)練，它同時也是一個多任務(wù)模型，可以進行多語言語音識別以及語音翻譯任務(wù)，可以將語音音頻轉(zhuǎn)錄為所講語言的文本，以及翻譯成英語文本。查看論文：https://cdn.openai.com/paper
2024年02月11日
瀏覽(19)
ubuntu16.04安裝語音識別whisper及whisper-ctranslate2工具（填坑篇）
環(huán)境：系統(tǒng)ubuntu16.04，顯卡是NVIDIA ?Quadro RTX5000 目標(biāo)：安裝語音識別工具whipser/whipser-ctranslate2 ????????因之前有過幾次在linux和windows上有過部署whisper經(jīng)驗和使用經(jīng)驗，其中有使用GPU的，有CPU的，各自語音識別效率一言難盡，建議直接裝whipser-ctranslate2。同時，感謝B站博主
2024年02月04日
瀏覽(23)
OpenAI開源語音識別模型Whisper在Windows系統(tǒng)的安裝詳細過程
Python的安裝很簡單，點擊這里進行下載。安裝完成之后，輸入python -V可以看到版本信息，說明已經(jīng)安裝成功了。如果輸入python -V命令沒有看到上面的這樣的信息，要么是安裝失敗，要么是安裝好之后沒有自動配置環(huán)境變量，如何配置環(huán)境變量可以從網(wǎng)上搜索。 Python的具體安
2024年02月08日
瀏覽(90)
如何一鍵生成字幕，如何快速處理生肉資源？借助whisper語音識別系統(tǒng)生成.srt字幕文件手把手教學(xué)在Windows、CPU版本下whisper的安裝與使用，快速上手！
Whisper是Open AI開源的語音識別網(wǎng)絡(luò)，支持98中語言，用于語音識別和翻譯等任務(wù)。我們可以將歌曲的歌詞進行識別，將無字幕的視頻資源自動生成字母，極大方便了用戶。同時，whisper可以在本地運行，充分保障了個人隱私。在識別方面也具有較準(zhǔn)確的識別能力。因此想通過本
2024年02月02日
瀏覽(55)
OpenAI Whisper 語音識別 API 模型使用 | python 語音識別
OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一個 Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后，把需要翻譯的音頻目錄放進去，運行程序即可生成音頻對應(yīng)的文字。以上。
2024年02月16日
瀏覽(93)
語音識別whisper
Whisper是一個通用的語音識別模型，它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練，能夠在英語語音識別上達到接近人類水平的魯棒性和準(zhǔn)確性1。Whisper還可以進行多語言語音識別、語音翻譯和語言識別等任務(wù)2。Whisper的架構(gòu)是一個簡單的端到端方法，采用了編碼器-解碼器
2024年02月12日
瀏覽(19)
語音識別 - ASR whisper
目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用
2024年02月12日
瀏覽(22)
Whisper 語音識別模型
Whisper 語音識別模型 Whisper 是一種通用的語音識別模型。它是在包含各種音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。開源項目地址：https://github.com/openai/whisper Whisper 語音識別模型 Transformer 序列到序列模型針對各種語音
2024年02月16日
瀏覽(25)
python語音識別whisper
一、背景最近想提取一些視頻的字幕，語音文案，研究了一波二、whisper語音識別 Whisper 是一種通用的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進行訓(xùn)練，也是一個多任務(wù)模型，可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。 stable-ts在 OpenAI 的 Whisper 之上修改并添加
2024年02月05日
瀏覽(86)
【語音識別】OpenAI whisper
目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用
2024年02月13日
瀏覽(90)