国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

這篇具有很好參考價(jià)值的文章主要介紹了OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1、安裝Python

Python的安裝很簡(jiǎn)單,點(diǎn)擊這里進(jìn)行下載。

安裝完成之后,輸入python -V可以看到版本信息,說明已經(jīng)安裝成功了。

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

如果輸入python -V命令沒有看到上面的這樣的信息,要么是安裝失敗,要么是安裝好之后沒有自動(dòng)配置環(huán)境變量,如何配置環(huán)境變量可以從網(wǎng)上搜索。

Python的具體安裝過程可以參考這篇文章。

2、安裝FFmpeg

ffmpeg是專門做音視頻處理用的軟件,并且是開源的,點(diǎn)擊這里進(jìn)行下載

安裝過程也是十分的簡(jiǎn)單,具體安裝過程可以到網(wǎng)上搜索,因?yàn)槲疫@里已經(jīng)安裝過了,所以沒辦法重新演示安裝過程。

這里需要注意,我們安裝完成之后還需要配置環(huán)境變量。

2.1、配置環(huán)境變量

如何配置環(huán)境變量,這里以Windows 11為例。

首先右擊桌面上的“此電腦”,然后點(diǎn)擊“屬性”,然后點(diǎn)擊“高級(jí)系統(tǒng)設(shè)置”,然后點(diǎn)擊“環(huán)境變量”,然后點(diǎn)擊“系統(tǒng)變量”中的“Path”,然后雙擊"Path"進(jìn)入到設(shè)置"Path"窗口,然后點(diǎn)擊“新建”,然后把你安裝FFmpeg的位置寫上,注意寫到bin目錄,最后記得點(diǎn)擊“確定”。

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

3、安裝顯卡驅(qū)動(dòng)

如過你沒有獨(dú)立顯卡,那么可以跳過這步。如果你使用的是AMD顯卡,那你也可以跳過這步了。

這里我以NVIDIA顯卡為例。

我自己電腦上的顯卡是NVIDIA MX150 2GB顯卡,所以我們安裝驅(qū)動(dòng)的時(shí)候也要選擇與自己顯卡類型一致的驅(qū)動(dòng)。

點(diǎn)擊這里下載顯卡驅(qū)動(dòng)

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

選擇完成之后,點(diǎn)擊“搜索”按鈕,就可以看到有哪些可以下載的顯卡驅(qū)動(dòng)了,最后點(diǎn)擊下載。

下載到本地之后,運(yùn)行安裝程序即可。

3.1、安裝CUDA

安裝完顯卡驅(qū)動(dòng)之后,我們打開顯卡控制面板,找到顯卡的信息,查看你顯卡支持的CUDA版本。

可以看到我這里是12.1版本。

然后我們可以去官網(wǎng)下載對(duì)應(yīng)版本的CUDA了,點(diǎn)擊這里去下載

你要根據(jù)自己使用的系統(tǒng)來選擇。

下載完成之后,直接雙擊運(yùn)行即可。

這里比較大,為了下載更快,我使用了多線程下載器IDM。

這里再提一句,我們一定要下載對(duì)應(yīng)版本的CUDA。

運(yùn)行之后,可以選擇自己安裝的位置。

選擇自定義安裝,然后把前面兩個(gè)勾選上。

然后是選擇安裝的位置。

然后你可能會(huì)安裝失敗。

我在安裝過程中就有一個(gè)沒有安裝成功,我們可以不管它。

我們打開cmd命令行窗口,然后輸入nvcc --version回車之后看到下面這些信息,說明安裝成功了。

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

如果你們不懂,可以看參考文章。

如果有需要的話,最好還要安裝一下cuDNN。這里我就不安裝了。具體可以參考這篇文章。

4、安裝PyTorch

簡(jiǎn)介:PyTorch是一個(gè)開源的Python機(jī)器學(xué)習(xí)庫,其前身是著名的機(jī)器學(xué)習(xí)庫Torch。2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch,它是一個(gè)面向Python語言的深度學(xué)習(xí)框架,不僅能夠?qū)崿F(xiàn)強(qiáng)大的GPU加速,同時(shí)還支持動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò),這是很多主流深度學(xué)習(xí)框架比如Tensorflow等都不支持的。PyTorch既可以看作加入了GPU支持的numpy,同時(shí)也可以看成一個(gè)擁有自動(dòng)求導(dǎo)功能的強(qiáng)大的深度神經(jīng)網(wǎng)絡(luò)。除了Facebook外,它已經(jīng)被Twitter、CMU和Salesforce等機(jī)構(gòu)采用。作為經(jīng)典機(jī)器學(xué)習(xí)庫Torch的端口,PyTorch 為 Python 語言使用者提供了舒適的深度學(xué)習(xí)開發(fā)選擇。

點(diǎn)擊這里下載PyTorch

這里說明一下,下載的PyTorch要與CUDA的版本一致,我這里使用的CUDA版本是12.1,但是我在官方PyTorch中沒有找到該版本的下載命令。然后我是從網(wǎng)上找到一個(gè)命令安裝了PyTorch。

pip --trusted-host pypi.tuna.tsinghua.edu.cn install torch==1.10.1+cu102 torchvision==0.11.2+cu102 torchaudio==0.10.1 -f https://download.pytorch.org/whl/torch_stable.html

安裝完成之后可以進(jìn)入python環(huán)境,如果輸入import torch沒有報(bào)錯(cuò),說明就可以了。

import torch
print(torch.__version__)
print(torch.cuda.is_available())

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

不過這里還是推薦大家下載與自己CUDA對(duì)應(yīng)的版本。

如果你覺得我寫的不夠具體,可以參考這篇文章。

5、安裝whisper

安裝whisper很簡(jiǎn)單,直接用一條命令即可。

pip install -U openai-whisper

不過使用這條命令安裝會(huì)很慢,我們可以使用清華鏡像。

pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

6、whisper的使用

安裝好后,我們使用下面的命令可以查看whisper如何使用。

whisper -h

我們現(xiàn)在就可以使用whisper來語音識(shí)別了。

whisper test.mp3 --model small --language Chinese

這里我們使用small模型,語言是中文,這樣我們就可以把test.mp3音頻文件轉(zhuǎn)為文本并輸出了。

我們可以指定輸出的格式,默認(rèn)是輸出所有格式文件。

--output_format {txt,vtt,srt,tsv,json,all}

我們也可以直接傳入視頻來識(shí)別音頻生成文件。

whisper test.mp4 --model small --output_format srt --language Chinese

如果你的顯存不過用會(huì)報(bào)下面的錯(cuò)誤。

RuntimeError: CUDA out of memory. Tried to allocate 226.00 MiB (GPU 0; 2.00 GiB total capacity;
1.34 GiB already allocated; 0 bytes free; 1.60 GiB reserved in total by PyTorch) If reserved 
memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  
See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

這個(gè)時(shí)候我們不要慌,我們還可以使用CPU,默認(rèn)是使用GPU的,我們可以通過參數(shù)--device來指定使用CPU進(jìn)行運(yùn)算。

whisper test.mp4 --model small --output_format srt --device cpu --language Chinese

我們可以省略--language Chinese,這個(gè)時(shí)候可以自動(dòng)識(shí)別出你音頻的語言。

當(dāng)我們使用CPU運(yùn)算時(shí),我們還可以指定使用的線程數(shù)量。

whisper test.mp4 --model small --output_format srt --device cpu --language Chinese --threads 8

7、總結(jié)

whisper對(duì)硬件的要不是很高,如果沒有獨(dú)顯,也可以使用CPU來運(yùn)行,但是使用CPU的運(yùn)算算力不及GPU強(qiáng)。

寫本篇文章主要是記錄一下在本地安裝whisper的過程。在安裝過程遇到很多坑,這里記錄一下,一則方便自己日后再次安裝,二是方便看這篇文章的你。

8、源碼下載

點(diǎn)擊這里下載源碼

9、視頻教程

點(diǎn)擊這里查看視頻內(nèi)容文章來源地址http://www.zghlxwxcb.cn/news/detail-477687.html

到了這里,關(guān)于OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 語音識(shí)別開源框架 openAI-whisper

    Whisper 是一種通用的語音識(shí)別模型。 它是OpenAI于2022年9月份開源的在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的語音識(shí)別模型,也是一個(gè)可以執(zhí)行多語言語音識(shí)別、語音翻譯和語言識(shí)別的多任務(wù)模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微調(diào)Whisper語音識(shí)別模型和加速推理,支持Web部署和Andr

    2024年02月17日
    瀏覽(97)
  • OpenAI開源?。hisper語音識(shí)別實(shí)戰(zhàn)??!【環(huán)境配置+代碼實(shí)現(xiàn)】

    OpenAI開源??!Whisper語音識(shí)別實(shí)戰(zhàn)!!【環(huán)境配置+代碼實(shí)現(xiàn)】

    目錄 環(huán)境配置 代碼實(shí)現(xiàn) ******? 實(shí)現(xiàn) .mp4轉(zhuǎn)換為 .wav文件,識(shí)別后進(jìn)行匹配并輸出出現(xiàn)的次數(shù) ******? 完整代碼實(shí)現(xiàn)請(qǐng)私信 安裝 ffmpeg 打開網(wǎng)址? ?https://github.com/BtbN/FFmpeg-Builds/releases 下載如下圖所示的文件 下載后解壓 ?我的路徑是G:ffmpeg-master-latest-win64-gpl-shared

    2024年02月13日
    瀏覽(25)
  • 可以白嫖的語音識(shí)別開源項(xiàng)目whisper的搭建詳細(xì)過程 | 如何在Linux中搭建OpenAI開源的語音識(shí)別項(xiàng)目Whisper

    可以白嫖的語音識(shí)別開源項(xiàng)目whisper的搭建詳細(xì)過程 | 如何在Linux中搭建OpenAI開源的語音識(shí)別項(xiàng)目Whisper

    原文來自我個(gè)人的博客。 服務(wù)器為GPU服務(wù)器。點(diǎn)擊這里跳轉(zhuǎn)到我使用的GPU服務(wù)器。我搭建 whisper 選用的是 NVIDIA A 100顯卡,4GB顯存。 Python版本要在3.8~3.11之間。 輸入下面命令查看使用的Python版本。 為啥要安裝Anaconda? 為了減少不同項(xiàng)目使用的庫的版本沖突,我們可以使用An

    2024年02月09日
    瀏覽(21)
  • OpenAI Whisper 語音識(shí)別 API 模型使用 | python 語音識(shí)別

    OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外,又推出了一個(gè) Whisper 的語音識(shí)別模型。支持96種語言。 Python 安裝 openai 庫后,把需要翻譯的音頻目錄放進(jìn)去,運(yùn)行程序即可生成音頻對(duì)應(yīng)的文字。 以上。

    2024年02月16日
    瀏覽(93)
  • OpenAI-whisper語音識(shí)別模型

    OpenAI-whisper語音識(shí)別模型

    Whisper是一個(gè)通用的語音識(shí)別模型。它是在不同音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個(gè)多任務(wù)模型,可以執(zhí)行多語言語音識(shí)別、語音翻譯和語言識(shí)別。 whisper有五種模型尺寸,提供速度和準(zhǔn)確性的平衡,其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求

    2024年02月09日
    瀏覽(100)
  • chatGPT的耳朵!OpenAI的開源語音識(shí)別AI:Whisper !

    chatGPT的耳朵!OpenAI的開源語音識(shí)別AI:Whisper !

    語音識(shí)別是通用人工智能的重要一環(huán)!可以說是AI的耳朵! 它可以讓機(jī)器理解人類的語音,并將其轉(zhuǎn)換為文本或其他形式的輸出。 語音識(shí)別的應(yīng)用場(chǎng)景非常廣泛,比如智能助理、語音搜索、語音翻譯、語音輸入等等。 然而,語音識(shí)別也面臨著很多挑戰(zhàn),比如不同的語言、口

    2024年03月14日
    瀏覽(26)
  • 使用OpenAI的Whisper 模型進(jìn)行語音識(shí)別

    使用OpenAI的Whisper 模型進(jìn)行語音識(shí)別

    原文:https://baijiahao.baidu.com/s?id=1756232395896695428wfr=spiderfor=pc 語音識(shí)別是人工智能中的一個(gè)領(lǐng)域,它允許計(jì)算機(jī)理解人類語音并將其轉(zhuǎn)換為文本。 該技術(shù)用于 Alexa 和各種聊天機(jī)器人應(yīng)用程序等設(shè)備。 而我們最常見的就是語音轉(zhuǎn)錄,語音轉(zhuǎn)錄可以語音轉(zhuǎn)換為文字記錄或字幕。

    2024年02月03日
    瀏覽(88)
  • 基于OpenAI的Whisper構(gòu)建的高效語音識(shí)別模型:faster-whisper

    基于OpenAI的Whisper構(gòu)建的高效語音識(shí)別模型:faster-whisper

    faster-whisper是基于OpenAI的Whisper模型的高效實(shí)現(xiàn),它利用CTranslate2,一個(gè)專為Transformer模型設(shè)計(jì)的快速推理引擎。這種實(shí)現(xiàn)不僅提高了語音識(shí)別的速度,還優(yōu)化了內(nèi)存使用效率。faster-whisper的核心優(yōu)勢(shì)在于其能夠在保持原有模型準(zhǔn)確度的同時(shí),大幅提升處理速度,這使得它在處理

    2024年02月02日
    瀏覽(94)
  • OpenAI的人工智能語音識(shí)別模型Whisper詳解及使用

    OpenAI的人工智能語音識(shí)別模型Whisper詳解及使用

    ????????擁有ChatGPT語言模型的OpenAI公司,開源了 Whisper 自動(dòng)語音識(shí)別系統(tǒng),OpenAI 強(qiáng)調(diào) Whisper 的語音識(shí)別能力已達(dá)到人類水準(zhǔn)。 ????????Whisper是一個(gè)通用的語音識(shí)別模型,它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練,能夠在英語語音識(shí)別上達(dá)到接近人類水平的魯

    2024年02月09日
    瀏覽(94)
  • 【語音識(shí)別】OpenAI whisper

    【語音識(shí)別】OpenAI whisper

    目錄 1. 簡(jiǎn)單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動(dòng)語音識(shí)別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用

    2024年02月13日
    瀏覽(90)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包