国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

無腦018——win11部署whisper,語音轉(zhuǎn)文字

這篇具有很好參考價(jià)值的文章主要介紹了無腦018——win11部署whisper,語音轉(zhuǎn)文字。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1.conda創(chuàng)建環(huán)境

conda create -n whisper python==3.9
conda activate whisper

安裝pytorch

pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

安裝whisper

pip install -U openai-whisper

2.準(zhǔn)備模型和測試音頻

因?yàn)槲业碾娔X是GTX 1060 顯存只有6G
最大運(yùn)行的模型是medium
所以去官網(wǎng)下載medium.pt模型
連接在這里:
https://github.com/openai/whisper/blob/main/whisper/init.py
win11語音轉(zhuǎn)文字 聲卡,無腦100,whisper
然后自己錄制一段mp3格式的音頻放在如下文件夾中
G:\desktop\whisper
win11語音轉(zhuǎn)文字 聲卡,無腦100,whisper

3.語音轉(zhuǎn)文字

3.1方法一:

打開conda窗口,進(jìn)入該文件夾,
用command窗口執(zhí)行的命令:

(whisper) G:\desktop\whisper>whisper test1.mp3 --model medium.pt
Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:06.700] 我現(xiàn)在正在測試OpenAI Whisper的翻譯效 果
[00:06.700 --> 00:08.000] 這里是中文
[00:08.000 --> 00:09.300] 現(xiàn)在是英文
[00:09.300 --> 00:10.200] English
[00:10.200 --> 00:11.300] American
[00:11.300 --> 00:12.000] China
[00:12.000 --> 00:12.900] People
[00:14.400 --> 00:16.900] 現(xiàn)在錄制時(shí)長是15分鐘
[00:16.900 --> 00:21.500] Now this is 18 second
[00:22.000 --> 00:26.300] And we will wait for 1 minute
[00:26.600 --> 00:28.800] 我們要一直等到1分鐘
[00:28.800 --> 00:30.200] 這個(gè)視頻結(jié)束
[00:30.200 --> 00:34.800] 來測試一下長視頻的長音頻的翻譯效果
[00:39.100 --> 00:50.700] 37 38 40 41 42 43 44 45 46 47 48 49 50
[00:50.700 --> 00:59.700] 5 4 3 2 1
[00:59.700 --> 01:01.200] 現(xiàn)在是1分鐘
[01:01.200 --> 01:03.200] This is 1 minute
                           

3.2 方法二:

寫一個(gè)python文件test.py調(diào)用:
test.py內(nèi)容如下

import whisper
model = whisper.load_model("medium.pt")
result = model.transcribe("test1.mp3")
print(result["text"])

運(yùn)行方式

(whisper) G:\desktop\whisper>python test.py
我現(xiàn)在正在測試OpenAI Whisper的翻譯效果這里是中文現(xiàn)在是英文EnglishAmericanChinaPeople現(xiàn)在錄制時(shí)長是15分鐘Now this is 18 secondsAnd we will wait for 1 minute我們要一直等到1分鐘這個(gè)視頻結(jié)束來測試一下長視頻的長音頻的翻譯效果3738404142434445464748495054321現(xiàn)在是1分鐘This is 1 minute

3.3 兩者的區(qū)別

用command輸出自動給你按照時(shí)間分類了,python代碼要自己補(bǔ)充
command輸出其他的文件,其中test1.txt是保存的識別的文字
win11語音轉(zhuǎn)文字 聲卡,無腦100,whisper
win11語音轉(zhuǎn)文字 聲卡,無腦100,whisper

祝大家開心!文章來源地址http://www.zghlxwxcb.cn/news/detail-762943.html

到了這里,關(guān)于無腦018——win11部署whisper,語音轉(zhuǎn)文字的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【軟件】無聯(lián)網(wǎng)情況下安裝Win11 / 華為電腦更換Win11系統(tǒng)后觸摸屏、聲卡失效物理解決方案

    【軟件】無聯(lián)網(wǎng)情況下安裝Win11 / 華為電腦更換Win11系統(tǒng)后觸摸屏、聲卡失效物理解決方案

    1)通過管理員身份打開命令提示符。 2)輸入命令:dism /online /export-driver /destination:\\\"D:備份驅(qū)動\\\" 即可將電腦驅(qū)動備份到 “ D盤備份驅(qū)動 ” 中。 注意這里 空格不要敲錯(cuò)了 ,同時(shí)要保證D盤里有備份驅(qū)動這個(gè)文件夾,?或者其他命名也都行。 備份好的驅(qū)動如下: 3)使用方式

    2024年02月11日
    瀏覽(23)
  • 使用openai-whisper實(shí)現(xiàn)語音轉(zhuǎn)文字

    使用openai-whisper實(shí)現(xiàn)語音轉(zhuǎn)文字

    FFmpeg是一套可以用來記錄、轉(zhuǎn)換數(shù)字音頻、視頻,并能將其轉(zhuǎn)化為流的開源計(jì)算機(jī)程序。采用LGPL或GPL許可證。它提供了錄制、轉(zhuǎn)換以及流化音視頻的完整解決方案。 在官網(wǎng)上選擇windows版本 在GitHub上可以選擇最新版本,選擇 ffmpeg-master-latest-win64-gpl.zip ; 如果python程序出現(xiàn)“

    2024年02月20日
    瀏覽(21)
  • 【openAI】Whisper如何高效語音轉(zhuǎn)文字(詳細(xì)教程)

    【openAI】Whisper如何高效語音轉(zhuǎn)文字(詳細(xì)教程)

    語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子: 1.字幕制作:語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕,這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具,字幕制作者可以更快地生成字幕,從而縮短制作時(shí)間,節(jié)省人工成本,并提高制

    2024年02月09日
    瀏覽(19)
  • Buzz語音轉(zhuǎn)文字安裝使用(含Whisper模型下載)

    Buzz語音轉(zhuǎn)文字安裝使用(含Whisper模型下載)

    Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper. 轉(zhuǎn)錄和翻譯音頻離線在您的個(gè)人計(jì)算機(jī)。由OpenAI的Whisper提供動力。 可以簡單理解為QT的前端界面,python語言構(gòu)建服務(wù)端,使用Whisper語言模型進(jìn)行計(jì)算語音轉(zhuǎn)文字的軟件。 痛點(diǎn)在于離線,缺點(diǎn)也很明顯,

    2024年02月05日
    瀏覽(21)
  • 記錄第一個(gè)復(fù)現(xiàn)的實(shí)時(shí)whisper語音轉(zhuǎn)文字demo

    記錄第一個(gè)復(fù)現(xiàn)的實(shí)時(shí)whisper語音轉(zhuǎn)文字demo

    使用的源碼來自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper. 安裝speech_recognition時(shí)需要安裝依賴包PyAudio、pocketsphinx 還需要安裝ffmpeg-python否則會報(bào)錯(cuò) 運(yùn)行效果如下: ?點(diǎn)擊運(yùn)行程序后出現(xiàn)model loaded 沒有錯(cuò)誤然后直接對著麥克風(fēng)說話即可

    2024年02月15日
    瀏覽(20)
  • OpenAI又一神器!Whisper 語音轉(zhuǎn)文字手把手教程

    OpenAI又一神器!Whisper 語音轉(zhuǎn)文字手把手教程

    語音轉(zhuǎn)文字在許多不同領(lǐng)域都有著廣泛的應(yīng)用。以下是一些例子: 1.字幕制作:語音轉(zhuǎn)文字可以幫助視頻制作者快速制作字幕,這在影視行業(yè)和網(wǎng)絡(luò)視頻領(lǐng)域非常重要。通過使用語音轉(zhuǎn)文字工具,字幕制作者可以更快地生成字幕,從而縮短制作時(shí)間,節(jié)省人工成本,并提高制

    2024年02月09日
    瀏覽(21)
  • 超快的 AI 實(shí)時(shí)語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項(xiàng)目 Faster Whisper

    超快的 AI 實(shí)時(shí)語音轉(zhuǎn)文字,比 OpenAI 的 Whisper 快4倍 -- 開源項(xiàng)目 Faster Whisper

    faster-whisper 這個(gè)項(xiàng)目是基于 OpenAI whisper 的模型,在上面的一個(gè)重寫。 使用的是 CTranslate2 的這樣的一個(gè)庫,CTranslate2 是用于 Transformer 模型的一個(gè)快速推理引擎。 在相同精度的情況下,faster-whisper 的速度比 OpenAI whisper 快 4 倍,并且使用更少的內(nèi)存。 這是 faster-whisper 與 OpenAI

    2024年03月27日
    瀏覽(22)
  • openai開源的whisper在huggingface中使用例子(語音轉(zhuǎn)文字中文)

    openai開源的whisper在huggingface中使用例子(語音轉(zhuǎn)文字中文)

    openai開源的語音轉(zhuǎn)文字支持多語言在huggingface中使用例子。 目前發(fā)現(xiàn)多語言模型large-v2支持中文是繁體,因此需要繁體轉(zhuǎn)簡體。 后續(xù)編寫微調(diào)訓(xùn)練例子 GitHub地址: https://github.com/openai/whisper

    2024年02月11日
    瀏覽(23)
  • 極速進(jìn)化,光速轉(zhuǎn)錄,C++版本人工智能實(shí)時(shí)語音轉(zhuǎn)文字(字幕/語音識別)Whisper.cpp實(shí)踐

    業(yè)界良心OpenAI開源的Whisper模型是開源語音轉(zhuǎn)文字領(lǐng)域的執(zhí)牛耳者,白璧微瑕之處在于無法通過蘋果M芯片優(yōu)化轉(zhuǎn)錄效率,Whisper.cpp 則是 Whisper 模型的 C/C++ 移植版本,它具有無依賴項(xiàng)、內(nèi)存使用量低等特點(diǎn),重要的是增加了 Core ML 支持,完美適配蘋果M系列芯片。 Whisper.cpp的張量

    2024年02月02日
    瀏覽(29)
  • 中文語音識別轉(zhuǎn)文字的王者,阿里達(dá)摩院FunAsr足可與Whisper相頡頑

    中文語音識別轉(zhuǎn)文字的王者,阿里達(dá)摩院FunAsr足可與Whisper相頡頑

    君不言語音識別技術(shù)則已,言則必稱Whisper,沒錯(cuò),OpenAi開源的Whisper確實(shí)是世界主流語音識別技術(shù)的魁首,但在中文領(lǐng)域,有一個(gè)足以和Whisper相頡頑的項(xiàng)目,那就是阿里達(dá)摩院自研的FunAsr。 FunAsr主要依托達(dá)摩院發(fā)布的Paraformer非自回歸端到端語音識別模型,它具有高精度、高

    2024年02月03日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包