国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

超快的 AI 實時語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項目 Faster Whisper

這篇具有很好參考價值的文章主要介紹了超快的 AI 實時語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項目 Faster Whisper。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

超快的 AI 實時語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項目 Faster Whisper,人工智能,whisper

faster-whisper 這個項目是基于 OpenAI whisper 的模型,在上面的一個重寫。

使用的是 CTranslate2 的這樣的一個庫,CTranslate2 是用于 Transformer 模型的一個快速推理引擎。

在相同精度的情況下,faster-whisper 的速度比 OpenAI whisper 快 4 倍,并且使用更少的內(nèi)存。

超快的 AI 實時語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項目 Faster Whisper,人工智能,whisper

這是 faster-whisper 與 OpenAI whisper 的測試對比結(jié)果,使用了一個13分鐘的音頻做的測試。

OpenAI whisper 用了4分30秒,faster-whisper 只用了54秒。

并且,faster-whisper 使用的 CPU 和 GPU 都只有 OpenAI whisper 的三分之一左右。

性能大幅提升,資源占用大幅降低,就是馬跑的更快了,吃的更少了。

感緊跑起來試試。

本地安裝運行

faster-whisper 需要 Python 3.8 之后的版本,可以創(chuàng)建Python虛擬環(huán)境來實現(xiàn)。

安裝 faster-whisper :

pip?install?faster-whisper

Python代碼:

from?faster_whisper?import?WhisperModel

#?指定模型
model_size?=?"large-v3"

#?or?run?on?CPU?with?INT8
model?=?WhisperModel(model_size,?device="cpu",?compute_type="int8")

#?加載音頻,執(zhí)行語音識別
segments,?info?=?model.transcribe("Haul.mp3",?beam_size=5)

print("Detected?language?'%s'?with?probability?%f"?%?(info.language,?info.language_probability))

for?segment?in?segments:
????print("[%.2fs?->?%.2fs]?%s"?%?(segment.start,?segment.end,?segment.text))

超快的 AI 實時語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項目 Faster Whisper,人工智能,whisper

第一次執(zhí)行時,會自動加載模型。

超快的 AI 實時語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項目 Faster Whisper,人工智能,whisper

然后開始識別,輸出識別結(jié)果。

以上是在 CPU 上的運行過程,如果想要更好的運行效率,自然是在 GPU 上跑。

使用 GPU,需要安裝一些輔助。

以 N 卡為例,先安裝 NVIDIA 相關(guān)的東西。

打開網(wǎng)頁:

developer.nvidia.com/cudnn

下載安裝。

打開網(wǎng)頁:

developer.nvidia.com/cuda-downloads

下載安裝。

安裝完成后,打開安裝目錄,例如我的是:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\bin

找到其中的文件 cublas64_12.dll,復(fù)制一份,改名為 cublas64_11.dll。

打開網(wǎng)頁:

github.com/Purfview/whisper-standalone-win/releases/tag/libs

下載解壓,根據(jù)提示放入相應(yīng)位置。

安裝依賴庫:

pip?install?nvidia-cublas-cu11?nvidia-cudnn-cu11

然后就可以使用 GPU 運行了。

Python 代碼:

from?faster_whisper?import?WhisperModel

model_size?=?"large-v3"

#?使用?GPU?運行,指定精度?INT8
model?=?WhisperModel(model_size,?device="cuda",?compute_type="int8_float16")

#?加載音頻并執(zhí)行識別
segments,?info?=?model.transcribe("Haul.mp3",?beam_size=5)

print("Detected?language?'%s'?with?probability?%f"?%?(info.language,?info.language_probability))

for?segment?in?segments:
????print("[%.2fs?->?%.2fs]?%s"?%?(segment.start,?segment.end,?segment.text))

怎么樣,感覺不錯吧,有興趣的話,快試試吧。

項目地址:

github.com/SYSTRAN/faster-whisper

#AI 人工智能,#OpenAI whisper, #fast-whisper,#ChatGPT,#語音轉(zhuǎn)文字,#gpt890

信息來源 gpt890.com/article/35文章來源地址http://www.zghlxwxcb.cn/news/detail-843831.html

到了這里,關(guān)于超快的 AI 實時語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項目 Faster Whisper的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Whisper 音頻轉(zhuǎn)文字模型體驗;語音實時轉(zhuǎn)錄文字工具

    Whisper 音頻轉(zhuǎn)文字模型體驗;語音實時轉(zhuǎn)錄文字工具

    參考: https://github.com/openai/whisper https://blog.csdn.net/weixin_44011409/article/details/127507692 安裝Whisper 和ffmpeg (# on Ubuntu or Debian sudo apt update sudo apt install ffmpeg on Windows using Chocolatey (https://chocolatey.org/) choco install ffmpeg on Windows using Scoop (https://scoop.sh/) scoop install ffmpeg)

    2024年02月11日
    瀏覽(23)
  • OpenAI又一神器!Whisper 語音轉(zhuǎn)文字手把手教程

    OpenAI又一神器!Whisper 語音轉(zhuǎn)文字手把手教程

    語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子: 1.字幕制作:語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕,這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具,字幕制作者可以更快地生成字幕,從而縮短制作時間,節(jié)省人工成本,并提高制

    2024年02月09日
    瀏覽(21)
  • OpenAI 開源語音識別 Whisper

    OpenAI 開源語音識別 Whisper

    ????????Whisper是一個通用語音識別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個多任務(wù)模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。???????? ???????人工智能公司 OpenAI?擁有 GTP-3 語言模型,并為 GitHub Copilot 提供技術(shù)支持的 ,宣布開源了

    2024年02月09日
    瀏覽(111)
  • Whisper OpenAI開源語音識別模型

    Whisper 是一個自動語音識別(ASR,Automatic Speech Recognition)系統(tǒng),OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時的多語言(98 種語言)和多任務(wù)(multitask)監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個龐大而多樣的數(shù)據(jù)集,可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除

    2024年02月16日
    瀏覽(96)
  • 記錄第一個復(fù)現(xiàn)的實時whisper語音轉(zhuǎn)文字demo

    記錄第一個復(fù)現(xiàn)的實時whisper語音轉(zhuǎn)文字demo

    使用的源碼來自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper. 安裝speech_recognition時需要安裝依賴包PyAudio、pocketsphinx 還需要安裝ffmpeg-python否則會報錯 運行效果如下: ?點擊運行程序后出現(xiàn)model loaded 沒有錯誤然后直接對著麥克風(fēng)說話即可

    2024年02月15日
    瀏覽(20)
  • 語音識別開源框架 openAI-whisper

    Whisper 是一種通用的語音識別模型。 它是OpenAI于2022年9月份開源的在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的語音識別模型,也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微調(diào)Whisper語音識別模型和加速推理,支持Web部署和Andr

    2024年02月17日
    瀏覽(97)
  • whisper 強大且開源的語音轉(zhuǎn)文字

    whisper 強大且開源的語音轉(zhuǎn)文字

    說起來語音轉(zhuǎn)換文字,openai旗下的whisper很是好用,推理也很快,同時支持cpu和GPU。 GitHub:GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision 相關(guān)的參數(shù)和內(nèi)存使用如下: Size Parameters English-only model Multilingual model Required VRAM Relative speed tiny 39 M tiny.en tiny ~1 GB ~32x

    2024年02月10日
    瀏覽(22)
  • .Net 使用OpenAI開源語音識別模型Whisper

    .Net 使用OpenAI開源語音識別模型Whisper

    .Net 使用OpenAI開源語音識別模型 Whisper Open AI在2022年9月21日開源了號稱其英文語音辨識能力已達(dá)到人類水準(zhǔn)的 Whisper 神經(jīng)網(wǎng)絡(luò),且它亦支持其它98種語言的自動語音辨識。 Whisper系統(tǒng)所提供的自動語音辨識(Automatic Speech Recognition,ASR)模型是被訓(xùn)練來運行語音辨識與翻譯任務(wù)的

    2024年02月08日
    瀏覽(86)
  • OpenAI開源!!Whisper語音識別實戰(zhàn)!!【環(huán)境配置+代碼實現(xiàn)】

    OpenAI開源!!Whisper語音識別實戰(zhàn)!!【環(huán)境配置+代碼實現(xiàn)】

    目錄 環(huán)境配置 代碼實現(xiàn) ******? 實現(xiàn) .mp4轉(zhuǎn)換為 .wav文件,識別后進(jìn)行匹配并輸出出現(xiàn)的次數(shù) ******? 完整代碼實現(xiàn)請私信 安裝 ffmpeg 打開網(wǎng)址? ?https://github.com/BtbN/FFmpeg-Builds/releases 下載如下圖所示的文件 下載后解壓 ?我的路徑是G:ffmpeg-master-latest-win64-gpl-shared

    2024年02月13日
    瀏覽(25)
  • 可以白嫖的語音識別開源項目whisper的搭建詳細(xì)過程 | 如何在Linux中搭建OpenAI開源的語音識別項目Whisper

    可以白嫖的語音識別開源項目whisper的搭建詳細(xì)過程 | 如何在Linux中搭建OpenAI開源的語音識別項目Whisper

    原文來自我個人的博客。 服務(wù)器為GPU服務(wù)器。點擊這里跳轉(zhuǎn)到我使用的GPU服務(wù)器。我搭建 whisper 選用的是 NVIDIA A 100顯卡,4GB顯存。 Python版本要在3.8~3.11之間。 輸入下面命令查看使用的Python版本。 為啥要安裝Anaconda? 為了減少不同項目使用的庫的版本沖突,我們可以使用An

    2024年02月09日
    瀏覽(21)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包