国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

無腦018——win11部署whisper，語音轉(zhuǎn)文字

2年前作者：吃肉不能購分類：Toy博客閱讀(15)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了無腦018——win11部署whisper，語音轉(zhuǎn)文字。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1.conda創(chuàng)建環(huán)境

conda create -n whisper python==3.9
conda activate whisper

安裝pytorch

pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

安裝whisper

pip install -U openai-whisper

2.準(zhǔn)備模型和測試音頻

因?yàn)槲业碾娔X是GTX 1060 顯存只有6G
最大運(yùn)行的模型是medium
所以去官網(wǎng)下載medium.pt模型
連接在這里：
https://github.com/openai/whisper/blob/main/whisper/init.py
win11語音轉(zhuǎn)文字聲卡,無腦100,whisper
然后自己錄制一段mp3格式的音頻放在如下文件夾中
G:\desktop\whisper

3.語音轉(zhuǎn)文字

3.1方法一：

打開conda窗口，進(jìn)入該文件夾，
用command窗口執(zhí)行的命令：

(whisper) G:\desktop\whisper>whisper test1.mp3 --model medium.pt
Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:06.700] 我現(xiàn)在正在測試OpenAI Whisper的翻譯效 果
[00:06.700 --> 00:08.000] 這里是中文
[00:08.000 --> 00:09.300] 現(xiàn)在是英文
[00:09.300 --> 00:10.200] English
[00:10.200 --> 00:11.300] American
[00:11.300 --> 00:12.000] China
[00:12.000 --> 00:12.900] People
[00:14.400 --> 00:16.900] 現(xiàn)在錄制時(shí)長是15分鐘
[00:16.900 --> 00:21.500] Now this is 18 second
[00:22.000 --> 00:26.300] And we will wait for 1 minute
[00:26.600 --> 00:28.800] 我們要一直等到1分鐘
[00:28.800 --> 00:30.200] 這個(gè)視頻結(jié)束
[00:30.200 --> 00:34.800] 來測試一下長視頻的長音頻的翻譯效果
[00:39.100 --> 00:50.700] 37 38 40 41 42 43 44 45 46 47 48 49 50
[00:50.700 --> 00:59.700] 5 4 3 2 1
[00:59.700 --> 01:01.200] 現(xiàn)在是1分鐘
[01:01.200 --> 01:03.200] This is 1 minute

3.2 方法二：

寫一個(gè)python文件test.py調(diào)用：
test.py內(nèi)容如下

import whisper
model = whisper.load_model("medium.pt")
result = model.transcribe("test1.mp3")
print(result["text"])

運(yùn)行方式

(whisper) G:\desktop\whisper>python test.py
我現(xiàn)在正在測試OpenAI Whisper的翻譯效果這里是中文現(xiàn)在是英文EnglishAmericanChinaPeople現(xiàn)在錄制時(shí)長是15分鐘Now this is 18 secondsAnd we will wait for 1 minute我們要一直等到1分鐘這個(gè)視頻結(jié)束來測試一下長視頻的長音頻的翻譯效果3738404142434445464748495054321現(xiàn)在是1分鐘This is 1 minute

3.3 兩者的區(qū)別

用command輸出自動給你按照時(shí)間分類了，python代碼要自己補(bǔ)充
command輸出其他的文件，其中test1.txt是保存的識別的文字
win11語音轉(zhuǎn)文字聲卡,無腦100,whisper

祝大家開心！文章來源地址http://www.zghlxwxcb.cn/news/detail-762943.html

到了這里，關(guān)于無腦018——win11部署whisper，語音轉(zhuǎn)文字的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【軟件】無聯(lián)網(wǎng)情況下安裝Win11 / 華為電腦更換Win11系統(tǒng)后觸摸屏、聲卡失效物理解決方案
1）通過管理員身份打開命令提示符。 2）輸入命令：dism /online /export-driver /destination:\\\"D:備份驅(qū)動\\\" 即可將電腦驅(qū)動備份到 “ D盤備份驅(qū)動 ” 中。注意這里空格不要敲錯(cuò)了，同時(shí)要保證D盤里有備份驅(qū)動這個(gè)文件夾，?或者其他命名也都行。備份好的驅(qū)動如下： 3）使用方式
2024年02月11日
瀏覽(23)
使用openai-whisper實(shí)現(xiàn)語音轉(zhuǎn)文字
FFmpeg是一套可以用來記錄、轉(zhuǎn)換數(shù)字音頻、視頻，并能將其轉(zhuǎn)化為流的開源計(jì)算機(jī)程序。采用LGPL或GPL許可證。它提供了錄制、轉(zhuǎn)換以及流化音視頻的完整解決方案。在官網(wǎng)上選擇windows版本在GitHub上可以選擇最新版本，選擇 ffmpeg-master-latest-win64-gpl.zip ；如果python程序出現(xiàn)“
2024年02月20日
瀏覽(21)
【openAI】Whisper如何高效語音轉(zhuǎn)文字（詳細(xì)教程）
語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子： 1.字幕制作：語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕，這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具，字幕制作者可以更快地生成字幕，從而縮短制作時(shí)間，節(jié)省人工成本，并提高制
2024年02月09日
瀏覽(19)
Buzz語音轉(zhuǎn)文字安裝使用(含Whisper模型下載)
Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper. 轉(zhuǎn)錄和翻譯音頻離線在您的個(gè)人計(jì)算機(jī)。由OpenAI的Whisper提供動力。可以簡單理解為QT的前端界面，python語言構(gòu)建服務(wù)端，使用Whisper語言模型進(jìn)行計(jì)算語音轉(zhuǎn)文字的軟件。痛點(diǎn)在于離線，缺點(diǎn)也很明顯，
2024年02月05日
瀏覽(21)
記錄第一個(gè)復(fù)現(xiàn)的實(shí)時(shí)whisper語音轉(zhuǎn)文字demo
使用的源碼來自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper. 安裝speech_recognition時(shí)需要安裝依賴包PyAudio、pocketsphinx 還需要安裝ffmpeg-python否則會報(bào)錯(cuò) 運(yùn)行效果如下： ?點(diǎn)擊運(yùn)行程序后出現(xiàn)model loaded 沒有錯(cuò)誤然后直接對著麥克風(fēng)說話即可
2024年02月15日
瀏覽(20)
OpenAI又一神器！Whisper 語音轉(zhuǎn)文字手把手教程
語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子： 1.字幕制作：語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕，這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具，字幕制作者可以更快地生成字幕，從而縮短制作時(shí)間，節(jié)省人工成本，并提高制
2024年02月09日
瀏覽(21)
超快的 AI 實(shí)時(shí)語音轉(zhuǎn)文字，比 OpenAI 的 Whisper 快4倍 -- 開源項(xiàng)目 Faster Whisper
faster-whisper 這個(gè)項(xiàng)目是基于 OpenAI whisper 的模型，在上面的一個(gè)重寫。使用的是 CTranslate2 的這樣的一個(gè)庫，CTranslate2 是用于 Transformer 模型的一個(gè)快速推理引擎。在相同精度的情況下，faster-whisper 的速度比 OpenAI whisper 快 4 倍，并且使用更少的內(nèi)存。這是 faster-whisper 與 OpenAI
2024年03月27日
瀏覽(22)
openai開源的whisper在huggingface中使用例子（語音轉(zhuǎn)文字中文）
openai開源的語音轉(zhuǎn)文字支持多語言在huggingface中使用例子。目前發(fā)現(xiàn)多語言模型large-v2支持中文是繁體，因此需要繁體轉(zhuǎn)簡體。后續(xù)編寫微調(diào)訓(xùn)練例子 GitHub地址： https://github.com/openai/whisper
2024年02月11日
瀏覽(23)
極速進(jìn)化,光速轉(zhuǎn)錄,C++版本人工智能實(shí)時(shí)語音轉(zhuǎn)文字(字幕/語音識別)Whisper.cpp實(shí)踐
業(yè)界良心OpenAI開源的Whisper模型是開源語音轉(zhuǎn)文字領(lǐng)域的執(zhí)牛耳者，白璧微瑕之處在于無法通過蘋果M芯片優(yōu)化轉(zhuǎn)錄效率，Whisper.cpp 則是 Whisper 模型的 C/C++ 移植版本，它具有無依賴項(xiàng)、內(nèi)存使用量低等特點(diǎn)，重要的是增加了 Core ML 支持，完美適配蘋果M系列芯片。 Whisper.cpp的張量
2024年02月02日
瀏覽(29)
中文語音識別轉(zhuǎn)文字的王者,阿里達(dá)摩院FunAsr足可與Whisper相頡頑
君不言語音識別技術(shù)則已，言則必稱Whisper，沒錯(cuò)，OpenAi開源的Whisper確實(shí)是世界主流語音識別技術(shù)的魁首，但在中文領(lǐng)域，有一個(gè)足以和Whisper相頡頑的項(xiàng)目，那就是阿里達(dá)摩院自研的FunAsr。 FunAsr主要依托達(dá)摩院發(fā)布的Paraformer非自回歸端到端語音識別模型，它具有高精度、高
2024年02月03日
瀏覽(26)