国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Linux 中的機器學(xué)習(xí):Whisper——自動語音識別系統(tǒng)

這篇具有很好參考價值的文章主要介紹了Linux 中的機器學(xué)習(xí):Whisper——自動語音識別系統(tǒng)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

Whisper 是一種自動語音識別 (ASR) 系統(tǒng),使用從網(wǎng)絡(luò)收集的 680000 小時多語言和多任務(wù)數(shù)據(jù)進(jìn)行訓(xùn)練,Whisper 由深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)提供支持,是一種基于 PyTorch 構(gòu)建的自然語言處理系統(tǒng),這是免費的開源軟件。

安裝Whisper

我們用 Ubuntu 22.04 LTS 測試了 Whisper,為避免污染您的系統(tǒng),我們建議使用 Anaconda 或 Miniconda 安裝 Whisper。

使用 wget 下載并安裝 Anaconda。

$ wget https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh

下載中的截圖:

Linux 中的機器學(xué)習(xí):Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper

運行shell腳本:

$ bash Anaconda3-2022.10-Linux-x86_64.sh

接受 Anaconda 的許可證,然后通過運行 conda init 來初始化 Anaconda3,要使更改生效,請關(guān)閉并重新打開當(dāng)前的 shell。

創(chuàng)建一個 conda 環(huán)境,并激活它。

$ conda create --name whisper
$ conda activate whisper

現(xiàn)在我們準(zhǔn)備好使用 pip 安裝 Whisper,pip 是 Python 的包管理器。

$ pip install -U openai-whisper

這是運行該命令的輸出。

Successfully built openai-whisper
Installing collected packages: tokenizers, huggingface-hub, transformers, openai-whisper
Successfully installed huggingface-hub-0.12.1 openai-whisper-20230124 tokenizers-0.13.2 transformers-4.26.1

運行whisper

whisper 是從命令行運行的,項目中沒有花哨的圖形用戶界面。

該軟件帶有一系列不同大小的預(yù)訓(xùn)練模型,可用于檢查 Whisper 的縮放屬性:

  • tiny.en
  • tiny
  • base.en
  • base
  • small.en
  • small
  • medium.en
  • medium
  • large-v1
  • large-v2
  • large

我們可以使用在 MP3 文件(也支持 FLAC 和 WAV)上使用媒體模型試用該軟件,第一次使用模型時,會下載該模型。

如果我們不指定帶有標(biāo)志的語言,–language軟件會自動檢測使用最多前 30 秒的語言。我們可以告訴軟件語言,避免自動檢測的開銷,一共支持 100 多種語言。

我們想要使用媒體模型轉(zhuǎn)錄 audio.mp3 文件,我們會告訴軟件這個文件是英語語言。

$ whisper audio.mp3 --model medium --language English

下圖顯示正在進(jìn)行的轉(zhuǎn)錄。

Linux 中的機器學(xué)習(xí):Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper

我們驗證此轉(zhuǎn)錄正在使用我們的 GPU。

Linux 中的機器學(xué)習(xí):Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper

你可以看到我們的 GPU 有 8GB 的VRAM,請注意,大型模型無法在此 GPU 上運行,因為它需要超過 8GB 的VRAM。

有大量可用的選項,比如$ whisper --help

總結(jié)

Whisper 還是蠻不錯的,從我們的測試來看,轉(zhuǎn)錄的準(zhǔn)確性非常接近人類水平的穩(wěn)健性和準(zhǔn)確性。

Whisper 沒有圖形界面,也不能錄制音頻。它只能獲取現(xiàn)有的音頻文件和輸出文本文件,Whisper 已經(jīng)積累了超過 25000 個 GitHub 星,還是非常受歡迎的。

代碼倉庫地址:https://github.com/openai/whisper

Linux 中的機器學(xué)習(xí):Whisper——自動語音識別系統(tǒng),機器學(xué)習(xí),linux,機器學(xué)習(xí),whisper文章來源地址http://www.zghlxwxcb.cn/news/detail-727637.html

到了這里,關(guān)于Linux 中的機器學(xué)習(xí):Whisper——自動語音識別系統(tǒng)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • AI機器學(xué)習(xí) | 基于librosa庫和使用scikit-learn庫中的分類器進(jìn)行語音識別

    AI機器學(xué)習(xí) | 基于librosa庫和使用scikit-learn庫中的分類器進(jìn)行語音識別

    專欄集錦,大佬們可以收藏以備不時之需 Spring Cloud實戰(zhàn)專欄:https://blog.csdn.net/superdangbo/category_9270827.html Python 實戰(zhàn)專欄:https://blog.csdn.net/superdangbo/category_9271194.html Logback 詳解專欄:https://blog.csdn.net/superdangbo/category_9271502.html tensorflow專欄:https://blog.csdn.net/superdangbo/category_869

    2024年02月05日
    瀏覽(21)
  • 如何一鍵生成字幕,如何快速處理生肉資源?借助whisper語音識別系統(tǒng)生成.srt字幕文件 手把手教學(xué)在Windows、CPU版本下whisper的安裝與使用,快速上手!

    如何一鍵生成字幕,如何快速處理生肉資源?借助whisper語音識別系統(tǒng)生成.srt字幕文件 手把手教學(xué)在Windows、CPU版本下whisper的安裝與使用,快速上手!

    Whisper是Open AI開源的語音識別網(wǎng)絡(luò),支持98中語言,用于語音識別和翻譯等任務(wù)。我們可以將歌曲的歌詞進(jìn)行識別,將無字幕的視頻資源自動生成字母,極大方便了用戶。同時,whisper可以在本地運行,充分保障了個人隱私。在識別方面也具有較準(zhǔn)確的識別能力。 因此想通過本

    2024年02月02日
    瀏覽(55)
  • OpenAI Whisper 語音識別 API 模型使用 | python 語音識別

    OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外,又推出了一個 Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后,把需要翻譯的音頻目錄放進(jìn)去,運行程序即可生成音頻對應(yīng)的文字。 以上。

    2024年02月16日
    瀏覽(93)
  • 智能語音機器人語音識別系統(tǒng)

    現(xiàn)有技術(shù)中實現(xiàn)一次性語音識別典型的流程時序,具體包括一下步驟: ■ MRCP Client發(fā)送INVITE消息給MRCP Server請求建立會話,攜帶MRCP Client側(cè)的SDP; ■ MRCP Server回復(fù)200表示請求已經(jīng)成功接受處理,攜帶MRCP Server側(cè)的SDP; ■ MRCP Client隨后發(fā)送ACK消息證實200消息已經(jīng)收到,至此一個

    2024年02月14日
    瀏覽(27)
  • 語音識別whisper

    Whisper是一個通用的語音識別模型,它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練,能夠在英語語音識別上達(dá)到接近人類水平的魯棒性和準(zhǔn)確性1。Whisper還可以進(jìn)行多語言語音識別、語音翻譯和語言識別等任務(wù)2。Whisper的架構(gòu)是一個簡單的端到端方法,采用了編碼器-解碼器

    2024年02月12日
    瀏覽(19)
  • 語音識別 - ASR whisper

    語音識別 - ASR whisper

    目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用

    2024年02月12日
    瀏覽(22)
  • Whisper 語音識別模型

    Whisper 語音識別模型 Whisper 是一種通用的語音識別模型。它是在包含各種音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。 開源項目地址:https://github.com/openai/whisper Whisper 語音識別模型 Transformer 序列到序列模型針對各種語音

    2024年02月16日
    瀏覽(25)
  • 【語音識別】OpenAI whisper

    【語音識別】OpenAI whisper

    目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用

    2024年02月13日
    瀏覽(90)
  • whisper 語音識別項目部署

    whisper 語音識別項目部署

    1.安裝anaconda軟件 在如下網(wǎng)盤免費獲取軟件: 鏈接:https://pan.baidu.com/s/1zOZCQOeiDhx6ebHh5zNasA 提取碼:hfnd 2.使用conda命令創(chuàng)建python3.8環(huán)境 3.進(jìn)入whisper虛擬環(huán)境 4.安裝cuda10.0的PyTorch環(huán)境 5.使用命令安裝whisper庫包 6.簡單使用命令識別一段語音: 6.安裝和配置ffmpeg軟件 在如下網(wǎng)盤免費

    2024年02月11日
    瀏覽(18)
  • 探索Whisper語音識別

    探索Whisper語音識別

    問題一:python多版本切換 背景:有了anaconda環(huán)境 ?還有一個c盤的不知道什么東西 我準(zhǔn)備下載一個python3.9.9 去官網(wǎng) 然后安裝,安裝之前一定要把原來的python卸載干凈。 ?3.9.9安裝不上,我用3.10 切換的話,就是去環(huán)境變量里面改變位置 ?最后發(fā)現(xiàn)直接用anaconda也可以,python3.8也

    2024年02月09日
    瀏覽(19)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包