国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<strike id="cndne"></strike>

<sup id="cndne"></sup>

<track id="cndne"><label id="cndne"></label></track>

whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字

2年前作者：第九系艾文分類：Toy博客閱讀(21)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

說起來語音轉(zhuǎn)換文字，openai旗下的whisper很是好用，推理也很快，同時(shí)支持cpu和GPU。

GitHub：GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

相關(guān)的參數(shù)和內(nèi)存使用如下：

Size	Parameters	English-only model	Multilingual model	Required VRAM	Relative speed
tiny	39 M	`tiny.en`	`tiny`	~1 GB	~32x
base	74 M	`base.en`	`base`	~1 GB	~16x
small	244 M	`small.en`	`small`	~2 GB	~6x
medium	769 M	`medium.en`	`medium`	~5 GB	~2x
large	1550 M	N/A	`large`	~10 GB	1x

CPU推理會慢一些，一般機(jī)器使用small模型即可，該模型內(nèi)存占用不是很高

1.安裝

a.直接通過pip安裝?

pip install -U openai-whisper
pip install setuptools-rust

b.通過git倉庫安裝

pip install git+https://github.com/openai/whisper.git

c.將安裝包升級到倉庫最新版

pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git

d.安裝 ffmpeg，本次系統(tǒng)是centos8stream，可以通過下面命令安裝

dnf install -y https://download1.rpmfusion.org/free/el/rpmfusion-free-release-8.noarch.rpm
dnf install -y install http://rpmfind.net/linux/epel/7/x86_64/Packages/s/SDL2-2.0.14-2.el7.x86_64.rpm
dnf install ffmpeg -y

其他系統(tǒng)可參考如下：

# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg

# on Arch Linux
sudo pacman -S ffmpeg

# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg

# on Windows using Chocolatey (https://chocolatey.org/)
choco install ffmpeg

# on Windows using Scoop (https://scoop.sh/)
scoop install ffmpeg

2.使用

可以通過Python進(jìn)行下面操作

import whisper

model = whisper.load_model("small") # 如果模型不存在，會自動下載，默認(rèn)下載路徑 "~/.cache/whisper"
result = model.transcribe("temp.wav") 
print(result["text"])

? whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字

?文章來源地址http://www.zghlxwxcb.cn/news/detail-499448.html

到了這里，關(guān)于whisper 強(qiáng)大且開源的語音轉(zhuǎn)文字的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

whisper 語音識別AI 聲音To文字
Whisper ?是一個(gè)由 OpenAI 訓(xùn)練并開源的神經(jīng)網(wǎng)絡(luò)，功能是語音識別,能把語音轉(zhuǎn)換為文字 ,在英語語音識別方面的穩(wěn)健性和準(zhǔn)確性接近人類水平。 1、Whisper支持語音轉(zhuǎn)錄和翻譯兩項(xiàng)功能并接受各種語音格式，模型中、英、法、德、意、日等主流語言上取得85%以上的準(zhǔn)確率，完全
2024年02月08日
瀏覽(95)
使用openai-whisper實(shí)現(xiàn)語音轉(zhuǎn)文字
FFmpeg是一套可以用來記錄、轉(zhuǎn)換數(shù)字音頻、視頻，并能將其轉(zhuǎn)化為流的開源計(jì)算機(jī)程序。采用LGPL或GPL許可證。它提供了錄制、轉(zhuǎn)換以及流化音視頻的完整解決方案。在官網(wǎng)上選擇windows版本在GitHub上可以選擇最新版本，選擇 ffmpeg-master-latest-win64-gpl.zip ；如果python程序出現(xiàn)“
2024年02月20日
瀏覽(21)
【openAI】Whisper如何高效語音轉(zhuǎn)文字（詳細(xì)教程）
語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子： 1.字幕制作：語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕，這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具，字幕制作者可以更快地生成字幕，從而縮短制作時(shí)間，節(jié)省人工成本，并提高制
2024年02月09日
瀏覽(19)
無腦018——win11部署whisper，語音轉(zhuǎn)文字
安裝pytorch 安裝whisper 因?yàn)槲业碾娔X是GTX 1060 顯存只有6G 最大運(yùn)行的模型是medium 所以去官網(wǎng)下載medium.pt模型連接在這里： https://github.com/openai/whisper/blob/main/whisper/ init .py 然后自己錄制一段mp3格式的音頻放在如下文件夾中 G:desktopwhisper 打開conda窗口，進(jìn)入該文件夾，用command窗
2024年02月04日
瀏覽(15)
Buzz語音轉(zhuǎn)文字安裝使用(含Whisper模型下載)
Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper. 轉(zhuǎn)錄和翻譯音頻離線在您的個(gè)人計(jì)算機(jī)。由OpenAI的Whisper提供動力。可以簡單理解為QT的前端界面，python語言構(gòu)建服務(wù)端，使用Whisper語言模型進(jìn)行計(jì)算語音轉(zhuǎn)文字的軟件。痛點(diǎn)在于離線，缺點(diǎn)也很明顯，
2024年02月05日
瀏覽(21)
記錄第一個(gè)復(fù)現(xiàn)的實(shí)時(shí)whisper語音轉(zhuǎn)文字demo
使用的源碼來自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper. 安裝speech_recognition時(shí)需要安裝依賴包PyAudio、pocketsphinx 還需要安裝ffmpeg-python否則會報(bào)錯(cuò) 運(yùn)行效果如下： ?點(diǎn)擊運(yùn)行程序后出現(xiàn)model loaded 沒有錯(cuò)誤然后直接對著麥克風(fēng)說話即可
2024年02月15日
瀏覽(19)
OpenAI又一神器！Whisper 語音轉(zhuǎn)文字手把手教程
語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子： 1.字幕制作：語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕，這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具，字幕制作者可以更快地生成字幕，從而縮短制作時(shí)間，節(jié)省人工成本，并提高制
2024年02月09日
瀏覽(21)
極速進(jìn)化,光速轉(zhuǎn)錄,C++版本人工智能實(shí)時(shí)語音轉(zhuǎn)文字(字幕/語音識別)Whisper.cpp實(shí)踐
業(yè)界良心OpenAI開源的Whisper模型是開源語音轉(zhuǎn)文字領(lǐng)域的執(zhí)牛耳者，白璧微瑕之處在于無法通過蘋果M芯片優(yōu)化轉(zhuǎn)錄效率，Whisper.cpp 則是 Whisper 模型的 C/C++ 移植版本，它具有無依賴項(xiàng)、內(nèi)存使用量低等特點(diǎn)，重要的是增加了 Core ML 支持，完美適配蘋果M系列芯片。 Whisper.cpp的張量
2024年02月02日
瀏覽(29)
中文語音識別轉(zhuǎn)文字的王者,阿里達(dá)摩院FunAsr足可與Whisper相頡頑
君不言語音識別技術(shù)則已，言則必稱Whisper，沒錯(cuò)，OpenAi開源的Whisper確實(shí)是世界主流語音識別技術(shù)的魁首，但在中文領(lǐng)域，有一個(gè)足以和Whisper相頡頑的項(xiàng)目，那就是阿里達(dá)摩院自研的FunAsr。 FunAsr主要依托達(dá)摩院發(fā)布的Paraformer非自回歸端到端語音識別模型，它具有高精度、高
2024年02月03日
瀏覽(26)
OpenAI 開源語音識別 Whisper
????????Whisper是一個(gè)通用語音識別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個(gè)多任務(wù)模型，可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。???????? ???????人工智能公司 OpenAI?擁有 GTP-3 語言模型，并為 GitHub Copilot 提供技術(shù)支持的，宣布開源了
2024年02月09日
瀏覽(111)

<sup id="girjf"><label id="girjf"></label></sup>

<menuitem id="girjf"></menuitem>

<menuitem id="girjf"></menuitem><track id="girjf"></track>