国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字

這篇具有很好參考價(jià)值的文章主要介紹了whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

說起來語音轉(zhuǎn)換文字,openai旗下的whisper很是好用,推理也很快,同時(shí)支持cpu和GPU。

GitHub:GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

相關(guān)的參數(shù)和內(nèi)存使用如下:

Size Parameters English-only model Multilingual model Required VRAM Relative speed
tiny 39 M tiny.en tiny ~1 GB ~32x
base 74 M base.en base ~1 GB ~16x
small 244 M small.en small ~2 GB ~6x
medium 769 M medium.en medium ~5 GB ~2x
large 1550 M N/A large ~10 GB 1x

CPU推理會慢一些,一般機(jī)器使用small模型即可,該模型內(nèi)存占用不是很高

1.安裝

a.直接通過pip安裝?

pip install -U openai-whisper
pip install setuptools-rust

b.通過git倉庫安裝

pip install git+https://github.com/openai/whisper.git 

c.將安裝包升級到倉庫最新版

pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git

d.安裝 ffmpeg,本次系統(tǒng)是centos8stream,可以通過下面命令安裝

dnf install -y https://download1.rpmfusion.org/free/el/rpmfusion-free-release-8.noarch.rpm
dnf install -y install http://rpmfind.net/linux/epel/7/x86_64/Packages/s/SDL2-2.0.14-2.el7.x86_64.rpm
dnf install ffmpeg -y

其他系統(tǒng)可參考如下:

# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg

# on Arch Linux
sudo pacman -S ffmpeg

# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg

# on Windows using Chocolatey (https://chocolatey.org/)
choco install ffmpeg

# on Windows using Scoop (https://scoop.sh/)
scoop install ffmpeg

2.使用

可以通過Python進(jìn)行下面操作

import whisper

model = whisper.load_model("small") # 如果模型不存在,會自動下載,默認(rèn)下載路徑 "~/.cache/whisper"
result = model.transcribe("temp.wav") 
print(result["text"])

?whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字

?文章來源地址http://www.zghlxwxcb.cn/news/detail-499448.html

到了這里,關(guān)于whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • whisper 語音識別AI 聲音To文字

    whisper 語音識別AI 聲音To文字

    Whisper ?是一個(gè)由 OpenAI 訓(xùn)練并開源的神經(jīng)網(wǎng)絡(luò),功能是語音識別,能把 語音 轉(zhuǎn)換為 文字 ,在英語語音識別方面的穩(wěn)健性和準(zhǔn)確性接近人類水平。 1、Whisper支持語音轉(zhuǎn)錄和翻譯兩項(xiàng)功能并接受各種語音格式,模型中、英、法、德、意、日等主流語言上取得85%以上的準(zhǔn)確率,完全

    2024年02月08日
    瀏覽(95)
  • 使用openai-whisper實(shí)現(xiàn)語音轉(zhuǎn)文字

    使用openai-whisper實(shí)現(xiàn)語音轉(zhuǎn)文字

    FFmpeg是一套可以用來記錄、轉(zhuǎn)換數(shù)字音頻、視頻,并能將其轉(zhuǎn)化為流的開源計(jì)算機(jī)程序。采用LGPL或GPL許可證。它提供了錄制、轉(zhuǎn)換以及流化音視頻的完整解決方案。 在官網(wǎng)上選擇windows版本 在GitHub上可以選擇最新版本,選擇 ffmpeg-master-latest-win64-gpl.zip ; 如果python程序出現(xiàn)“

    2024年02月20日
    瀏覽(21)
  • 【openAI】Whisper如何高效語音轉(zhuǎn)文字(詳細(xì)教程)

    【openAI】Whisper如何高效語音轉(zhuǎn)文字(詳細(xì)教程)

    語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子: 1.字幕制作:語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕,這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具,字幕制作者可以更快地生成字幕,從而縮短制作時(shí)間,節(jié)省人工成本,并提高制

    2024年02月09日
    瀏覽(19)
  • 無腦018——win11部署whisper,語音轉(zhuǎn)文字

    無腦018——win11部署whisper,語音轉(zhuǎn)文字

    安裝pytorch 安裝whisper 因?yàn)槲业碾娔X是GTX 1060 顯存只有6G 最大運(yùn)行的模型是medium 所以去官網(wǎng)下載medium.pt模型 連接在這里: https://github.com/openai/whisper/blob/main/whisper/ init .py 然后自己錄制一段mp3格式的音頻放在如下文件夾中 G:desktopwhisper 打開conda窗口,進(jìn)入該文件夾, 用command窗

    2024年02月04日
    瀏覽(15)
  • Buzz語音轉(zhuǎn)文字安裝使用(含Whisper模型下載)

    Buzz語音轉(zhuǎn)文字安裝使用(含Whisper模型下載)

    Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper. 轉(zhuǎn)錄和翻譯音頻離線在您的個(gè)人計(jì)算機(jī)。由OpenAI的Whisper提供動力。 可以簡單理解為QT的前端界面,python語言構(gòu)建服務(wù)端,使用Whisper語言模型進(jìn)行計(jì)算語音轉(zhuǎn)文字的軟件。 痛點(diǎn)在于離線,缺點(diǎn)也很明顯,

    2024年02月05日
    瀏覽(21)
  • 記錄第一個(gè)復(fù)現(xiàn)的實(shí)時(shí)whisper語音轉(zhuǎn)文字demo

    記錄第一個(gè)復(fù)現(xiàn)的實(shí)時(shí)whisper語音轉(zhuǎn)文字demo

    使用的源碼來自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper. 安裝speech_recognition時(shí)需要安裝依賴包PyAudio、pocketsphinx 還需要安裝ffmpeg-python否則會報(bào)錯(cuò) 運(yùn)行效果如下: ?點(diǎn)擊運(yùn)行程序后出現(xiàn)model loaded 沒有錯(cuò)誤然后直接對著麥克風(fēng)說話即可

    2024年02月15日
    瀏覽(19)
  • OpenAI又一神器!Whisper 語音轉(zhuǎn)文字手把手教程

    OpenAI又一神器!Whisper 語音轉(zhuǎn)文字手把手教程

    語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子: 1.字幕制作:語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕,這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具,字幕制作者可以更快地生成字幕,從而縮短制作時(shí)間,節(jié)省人工成本,并提高制

    2024年02月09日
    瀏覽(21)
  • 極速進(jìn)化,光速轉(zhuǎn)錄,C++版本人工智能實(shí)時(shí)語音轉(zhuǎn)文字(字幕/語音識別)Whisper.cpp實(shí)踐

    業(yè)界良心OpenAI開源的Whisper模型是開源語音轉(zhuǎn)文字領(lǐng)域的執(zhí)牛耳者,白璧微瑕之處在于無法通過蘋果M芯片優(yōu)化轉(zhuǎn)錄效率,Whisper.cpp 則是 Whisper 模型的 C/C++ 移植版本,它具有無依賴項(xiàng)、內(nèi)存使用量低等特點(diǎn),重要的是增加了 Core ML 支持,完美適配蘋果M系列芯片。 Whisper.cpp的張量

    2024年02月02日
    瀏覽(29)
  • 中文語音識別轉(zhuǎn)文字的王者,阿里達(dá)摩院FunAsr足可與Whisper相頡頑

    中文語音識別轉(zhuǎn)文字的王者,阿里達(dá)摩院FunAsr足可與Whisper相頡頑

    君不言語音識別技術(shù)則已,言則必稱Whisper,沒錯(cuò),OpenAi開源的Whisper確實(shí)是世界主流語音識別技術(shù)的魁首,但在中文領(lǐng)域,有一個(gè)足以和Whisper相頡頑的項(xiàng)目,那就是阿里達(dá)摩院自研的FunAsr。 FunAsr主要依托達(dá)摩院發(fā)布的Paraformer非自回歸端到端語音識別模型,它具有高精度、高

    2024年02月03日
    瀏覽(26)
  • OpenAI 開源語音識別 Whisper

    OpenAI 開源語音識別 Whisper

    ????????Whisper是一個(gè)通用語音識別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個(gè)多任務(wù)模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。???????? ???????人工智能公司 OpenAI?擁有 GTP-3 語言模型,并為 GitHub Copilot 提供技術(shù)支持的 ,宣布開源了

    2024年02月09日
    瀏覽(111)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包