国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<b id="x48vf"><rt id="x48vf"></rt></b><option id="x48vf"><del id="x48vf"><form id="x48vf"></form></del></option>

<b id="x48vf"></b><b id="x48vf"></b>

<strong id="x48vf"></strong>

<tbody id="x48vf"></tbody>

^{<tfoot id="x48vf"></tfoot>}

Linux 中的機器學(xué)習(xí)：Whisper——自動語音識別系統(tǒng)

2年前作者：wljslmz分類：Toy博客閱讀(17)違法舉報

這篇具有很好參考價值的文章主要介紹了Linux 中的機器學(xué)習(xí)：Whisper——自動語音識別系統(tǒng)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

Whisper 是一種自動語音識別 (ASR) 系統(tǒng)，使用從網(wǎng)絡(luò)收集的 680000 小時多語言和多任務(wù)數(shù)據(jù)進(jìn)行訓(xùn)練，Whisper 由深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)提供支持，是一種基于 PyTorch 構(gòu)建的自然語言處理系統(tǒng)，這是免費的開源軟件。

安裝Whisper

我們用 Ubuntu 22.04 LTS 測試了 Whisper，為避免污染您的系統(tǒng)，我們建議使用 Anaconda 或 Miniconda 安裝 Whisper。

使用 wget 下載并安裝 Anaconda。

$ wget https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh

下載中的截圖：

Linux 中的機器學(xué)習(xí)：Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper

運行shell腳本：

$ bash Anaconda3-2022.10-Linux-x86_64.sh

接受 Anaconda 的許可證，然后通過運行 conda init 來初始化 Anaconda3，要使更改生效，請關(guān)閉并重新打開當(dāng)前的 shell。

創(chuàng)建一個 conda 環(huán)境，并激活它。

$ conda create --name whisper
$ conda activate whisper

現(xiàn)在我們準(zhǔn)備好使用 pip 安裝 Whisper，pip 是 Python 的包管理器。

$ pip install -U openai-whisper

這是運行該命令的輸出。

Successfully built openai-whisper
Installing collected packages: tokenizers, huggingface-hub, transformers, openai-whisper
Successfully installed huggingface-hub-0.12.1 openai-whisper-20230124 tokenizers-0.13.2 transformers-4.26.1

運行whisper

whisper 是從命令行運行的，項目中沒有花哨的圖形用戶界面。

該軟件帶有一系列不同大小的預(yù)訓(xùn)練模型，可用于檢查 Whisper 的縮放屬性：

tiny.en
tiny
base.en
base
small.en
small
medium.en
medium
large-v1
large-v2
large

我們可以使用在 MP3 文件（也支持 FLAC 和 WAV）上使用媒體模型試用該軟件，第一次使用模型時，會下載該模型。

如果我們不指定帶有標(biāo)志的語言，–language軟件會自動檢測使用最多前 30 秒的語言。我們可以告訴軟件語言，避免自動檢測的開銷，一共支持 100 多種語言。

我們想要使用媒體模型轉(zhuǎn)錄 audio.mp3 文件，我們會告訴軟件這個文件是英語語言。

$ whisper audio.mp3 --model medium --language English

下圖顯示正在進(jìn)行的轉(zhuǎn)錄。

Linux 中的機器學(xué)習(xí)：Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper

我們驗證此轉(zhuǎn)錄正在使用我們的 GPU。

Linux 中的機器學(xué)習(xí)：Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper

你可以看到我們的 GPU 有 8GB 的VRAM，請注意，大型模型無法在此 GPU 上運行，因為它需要超過 8GB 的VRAM。

有大量可用的選項，比如$ whisper --help

總結(jié)

Whisper 還是蠻不錯的，從我們的測試來看，轉(zhuǎn)錄的準(zhǔn)確性非常接近人類水平的穩(wěn)健性和準(zhǔn)確性。

Whisper 沒有圖形界面，也不能錄制音頻。它只能獲取現(xiàn)有的音頻文件和輸出文本文件，Whisper 已經(jīng)積累了超過 25000 個 GitHub 星，還是非常受歡迎的。

代碼倉庫地址：https://github.com/openai/whisper。

Linux 中的機器學(xué)習(xí)：Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper 文章來源地址http://www.zghlxwxcb.cn/news/detail-727637.html

到了這里，關(guān)于Linux 中的機器學(xué)習(xí)：Whisper——自動語音識別系統(tǒng)的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

AI機器學(xué)習(xí) | 基于librosa庫和使用scikit-learn庫中的分類器進(jìn)行語音識別
專欄集錦，大佬們可以收藏以備不時之需 Spring Cloud實戰(zhàn)專欄：https://blog.csdn.net/superdangbo/category_9270827.html Python 實戰(zhàn)專欄：https://blog.csdn.net/superdangbo/category_9271194.html Logback 詳解專欄：https://blog.csdn.net/superdangbo/category_9271502.html tensorflow專欄：https://blog.csdn.net/superdangbo/category_869
2024年02月05日
瀏覽(21)
如何一鍵生成字幕，如何快速處理生肉資源？借助whisper語音識別系統(tǒng)生成.srt字幕文件手把手教學(xué)在Windows、CPU版本下whisper的安裝與使用，快速上手！
Whisper是Open AI開源的語音識別網(wǎng)絡(luò)，支持98中語言，用于語音識別和翻譯等任務(wù)。我們可以將歌曲的歌詞進(jìn)行識別，將無字幕的視頻資源自動生成字母，極大方便了用戶。同時，whisper可以在本地運行，充分保障了個人隱私。在識別方面也具有較準(zhǔn)確的識別能力。因此想通過本
2024年02月02日
瀏覽(55)
OpenAI Whisper 語音識別 API 模型使用 | python 語音識別
OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一個 Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后，把需要翻譯的音頻目錄放進(jìn)去，運行程序即可生成音頻對應(yīng)的文字。以上。
2024年02月16日
瀏覽(93)
智能語音機器人語音識別系統(tǒng)
現(xiàn)有技術(shù)中實現(xiàn)一次性語音識別典型的流程時序，具體包括一下步驟： ■ MRCP Client發(fā)送INVITE消息給MRCP Server請求建立會話，攜帶MRCP Client側(cè)的SDP； ■ MRCP Server回復(fù)200表示請求已經(jīng)成功接受處理，攜帶MRCP Server側(cè)的SDP； ■ MRCP Client隨后發(fā)送ACK消息證實200消息已經(jīng)收到，至此一個
2024年02月14日
瀏覽(27)
語音識別whisper
Whisper是一個通用的語音識別模型，它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練，能夠在英語語音識別上達(dá)到接近人類水平的魯棒性和準(zhǔn)確性1。Whisper還可以進(jìn)行多語言語音識別、語音翻譯和語言識別等任務(wù)2。Whisper的架構(gòu)是一個簡單的端到端方法，采用了編碼器-解碼器
2024年02月12日
瀏覽(19)
語音識別 - ASR whisper
目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用
2024年02月12日
瀏覽(22)
Whisper 語音識別模型
Whisper 語音識別模型 Whisper 是一種通用的語音識別模型。它是在包含各種音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。開源項目地址：https://github.com/openai/whisper Whisper 語音識別模型 Transformer 序列到序列模型針對各種語音
2024年02月16日
瀏覽(25)
【語音識別】OpenAI whisper
目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用
2024年02月13日
瀏覽(90)
whisper 語音識別項目部署
1.安裝anaconda軟件在如下網(wǎng)盤免費獲取軟件：鏈接：https://pan.baidu.com/s/1zOZCQOeiDhx6ebHh5zNasA 提取碼：hfnd 2.使用conda命令創(chuàng)建python3.8環(huán)境 3.進(jìn)入whisper虛擬環(huán)境 4.安裝cuda10.0的PyTorch環(huán)境 5.使用命令安裝whisper庫包 6.簡單使用命令識別一段語音： 6.安裝和配置ffmpeg軟件在如下網(wǎng)盤免費
2024年02月11日
瀏覽(18)
探索Whisper語音識別
問題一：python多版本切換背景：有了anaconda環(huán)境 ?還有一個c盤的不知道什么東西我準(zhǔn)備下載一個python3.9.9 去官網(wǎng) 然后安裝，安裝之前一定要把原來的python卸載干凈。 ?3.9.9安裝不上，我用3.10 切換的話，就是去環(huán)境變量里面改變位置 ?最后發(fā)現(xiàn)直接用anaconda也可以，python3.8也
2024年02月09日
瀏覽(19)