国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<sup id="nilyd"></sup>

<mark id="nilyd"><track id="nilyd"><table id="nilyd"></table></track></mark>

<pre id="nilyd"></pre>

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

2年前作者：Luke Ewin分類：Toy博客閱讀(89)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1、安裝Python

Python的安裝很簡(jiǎn)單，點(diǎn)擊這里進(jìn)行下載。

安裝完成之后，輸入python -V可以看到版本信息，說明已經(jīng)安裝成功了。

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

如果輸入python -V命令沒有看到上面的這樣的信息，要么是安裝失敗，要么是安裝好之后沒有自動(dòng)配置環(huán)境變量，如何配置環(huán)境變量可以從網(wǎng)上搜索。

Python的具體安裝過程可以參考這篇文章。

2、安裝FFmpeg

ffmpeg是專門做音視頻處理用的軟件，并且是開源的，點(diǎn)擊這里進(jìn)行下載

安裝過程也是十分的簡(jiǎn)單，具體安裝過程可以到網(wǎng)上搜索，因?yàn)槲疫@里已經(jīng)安裝過了，所以沒辦法重新演示安裝過程。

這里需要注意，我們安裝完成之后還需要配置環(huán)境變量。

2.1、配置環(huán)境變量

如何配置環(huán)境變量，這里以Windows 11為例。

首先右擊桌面上的“此電腦”，然后點(diǎn)擊“屬性”，然后點(diǎn)擊“高級(jí)系統(tǒng)設(shè)置”，然后點(diǎn)擊“環(huán)境變量”，然后點(diǎn)擊“系統(tǒng)變量”中的“Path”，然后雙擊"Path"進(jìn)入到設(shè)置"Path"窗口，然后點(diǎn)擊“新建”，然后把你安裝FFmpeg的位置寫上，注意寫到bin目錄，最后記得點(diǎn)擊“確定”。

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

3、安裝顯卡驅(qū)動(dòng)

如過你沒有獨(dú)立顯卡，那么可以跳過這步。如果你使用的是AMD顯卡，那你也可以跳過這步了。

這里我以NVIDIA顯卡為例。

我自己電腦上的顯卡是NVIDIA MX150 2GB顯卡，所以我們安裝驅(qū)動(dòng)的時(shí)候也要選擇與自己顯卡類型一致的驅(qū)動(dòng)。

點(diǎn)擊這里下載顯卡驅(qū)動(dòng)

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

選擇完成之后，點(diǎn)擊“搜索”按鈕，就可以看到有哪些可以下載的顯卡驅(qū)動(dòng)了，最后點(diǎn)擊下載。

下載到本地之后，運(yùn)行安裝程序即可。

3.1、安裝CUDA

安裝完顯卡驅(qū)動(dòng)之后，我們打開顯卡控制面板，找到顯卡的信息，查看你顯卡支持的CUDA版本。

可以看到我這里是12.1版本。

然后我們可以去官網(wǎng)下載對(duì)應(yīng)版本的CUDA了，點(diǎn)擊這里去下載

你要根據(jù)自己使用的系統(tǒng)來選擇。

下載完成之后，直接雙擊運(yùn)行即可。

這里比較大，為了下載更快，我使用了多線程下載器IDM。

這里再提一句，我們一定要下載對(duì)應(yīng)版本的CUDA。

運(yùn)行之后，可以選擇自己安裝的位置。

選擇自定義安裝，然后把前面兩個(gè)勾選上。

然后是選擇安裝的位置。

然后你可能會(huì)安裝失敗。

我在安裝過程中就有一個(gè)沒有安裝成功，我們可以不管它。

我們打開cmd命令行窗口，然后輸入nvcc --version回車之后看到下面這些信息，說明安裝成功了。

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

如果你們不懂，可以看參考文章。

如果有需要的話，最好還要安裝一下cuDNN。這里我就不安裝了。具體可以參考這篇文章。

4、安裝PyTorch

簡(jiǎn)介：PyTorch是一個(gè)開源的Python機(jī)器學(xué)習(xí)庫，其前身是著名的機(jī)器學(xué)習(xí)庫Torch。2017年1月，由Facebook人工智能研究院（FAIR）基于Torch推出了PyTorch，它是一個(gè)面向Python語言的深度學(xué)習(xí)框架，不僅能夠?qū)崿F(xiàn)強(qiáng)大的GPU加速，同時(shí)還支持動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)，這是很多主流深度學(xué)習(xí)框架比如Tensorflow等都不支持的。PyTorch既可以看作加入了GPU支持的numpy，同時(shí)也可以看成一個(gè)擁有自動(dòng)求導(dǎo)功能的強(qiáng)大的深度神經(jīng)網(wǎng)絡(luò)。除了Facebook外，它已經(jīng)被Twitter、CMU和Salesforce等機(jī)構(gòu)采用。作為經(jīng)典機(jī)器學(xué)習(xí)庫Torch的端口，PyTorch 為 Python 語言使用者提供了舒適的深度學(xué)習(xí)開發(fā)選擇。

點(diǎn)擊這里下載PyTorch

這里說明一下，下載的PyTorch要與CUDA的版本一致，我這里使用的CUDA版本是12.1，但是我在官方PyTorch中沒有找到該版本的下載命令。然后我是從網(wǎng)上找到一個(gè)命令安裝了PyTorch。

pip --trusted-host pypi.tuna.tsinghua.edu.cn install torch==1.10.1+cu102 torchvision==0.11.2+cu102 torchaudio==0.10.1 -f https://download.pytorch.org/whl/torch_stable.html

安裝完成之后可以進(jìn)入python環(huán)境，如果輸入import torch沒有報(bào)錯(cuò)，說明就可以了。

import torch
print(torch.__version__)
print(torch.cuda.is_available())

OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

不過這里還是推薦大家下載與自己CUDA對(duì)應(yīng)的版本。

如果你覺得我寫的不夠具體，可以參考這篇文章。

5、安裝whisper

安裝whisper很簡(jiǎn)單，直接用一條命令即可。

pip install -U openai-whisper

不過使用這條命令安裝會(huì)很慢，我們可以使用清華鏡像。

pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

6、whisper的使用

安裝好后，我們使用下面的命令可以查看whisper如何使用。

whisper -h

我們現(xiàn)在就可以使用whisper來語音識(shí)別了。

whisper test.mp3 --model small --language Chinese

這里我們使用small模型，語言是中文，這樣我們就可以把test.mp3音頻文件轉(zhuǎn)為文本并輸出了。

我們可以指定輸出的格式，默認(rèn)是輸出所有格式文件。

--output_format {txt,vtt,srt,tsv,json,all}

我們也可以直接傳入視頻來識(shí)別音頻生成文件。

whisper test.mp4 --model small --output_format srt --language Chinese

如果你的顯存不過用會(huì)報(bào)下面的錯(cuò)誤。

RuntimeError: CUDA out of memory. Tried to allocate 226.00 MiB (GPU 0; 2.00 GiB total capacity;
1.34 GiB already allocated; 0 bytes free; 1.60 GiB reserved in total by PyTorch) If reserved 
memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  
See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

這個(gè)時(shí)候我們不要慌，我們還可以使用CPU，默認(rèn)是使用GPU的，我們可以通過參數(shù)--device來指定使用CPU進(jìn)行運(yùn)算。

whisper test.mp4 --model small --output_format srt --device cpu --language Chinese

我們可以省略--language Chinese，這個(gè)時(shí)候可以自動(dòng)識(shí)別出你音頻的語言。

當(dāng)我們使用CPU運(yùn)算時(shí)，我們還可以指定使用的線程數(shù)量。

whisper test.mp4 --model small --output_format srt --device cpu --language Chinese --threads 8

7、總結(jié)

whisper對(duì)硬件的要不是很高，如果沒有獨(dú)顯，也可以使用CPU來運(yùn)行，但是使用CPU的運(yùn)算算力不及GPU強(qiáng)。

寫本篇文章主要是記錄一下在本地安裝whisper的過程。在安裝過程遇到很多坑，這里記錄一下，一則方便自己日后再次安裝，二是方便看這篇文章的你。

8、源碼下載

點(diǎn)擊這里下載源碼

9、視頻教程

點(diǎn)擊這里查看視頻內(nèi)容文章來源地址http://www.zghlxwxcb.cn/news/detail-477687.html

到了這里，關(guān)于OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

語音識(shí)別開源框架 openAI-whisper
Whisper 是一種通用的語音識(shí)別模型。它是OpenAI于2022年9月份開源的在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的語音識(shí)別模型，也是一個(gè)可以執(zhí)行多語言語音識(shí)別、語音翻譯和語言識(shí)別的多任務(wù)模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微調(diào)Whisper語音識(shí)別模型和加速推理，支持Web部署和Andr
2024年02月17日
瀏覽(97)
OpenAI開源??！Whisper語音識(shí)別實(shí)戰(zhàn)！！【環(huán)境配置+代碼實(shí)現(xiàn)】
目錄環(huán)境配置代碼實(shí)現(xiàn) ******? 實(shí)現(xiàn) .mp4轉(zhuǎn)換為 .wav文件，識(shí)別后進(jìn)行匹配并輸出出現(xiàn)的次數(shù) ******? 完整代碼實(shí)現(xiàn)請(qǐng)私信安裝 ffmpeg 打開網(wǎng)址? ?https://github.com/BtbN/FFmpeg-Builds/releases 下載如下圖所示的文件下載后解壓 ?我的路徑是G:ffmpeg-master-latest-win64-gpl-shared
2024年02月13日
瀏覽(25)
可以白嫖的語音識(shí)別開源項(xiàng)目whisper的搭建詳細(xì)過程 | 如何在Linux中搭建OpenAI開源的語音識(shí)別項(xiàng)目Whisper
原文來自我個(gè)人的博客。服務(wù)器為GPU服務(wù)器。點(diǎn)擊這里跳轉(zhuǎn)到我使用的GPU服務(wù)器。我搭建 whisper 選用的是 NVIDIA A 100顯卡，4GB顯存。 Python版本要在3.8~3.11之間。輸入下面命令查看使用的Python版本。為啥要安裝Anaconda？為了減少不同項(xiàng)目使用的庫的版本沖突，我們可以使用An
2024年02月09日
瀏覽(21)
OpenAI Whisper 語音識(shí)別 API 模型使用 | python 語音識(shí)別
OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一個(gè) Whisper 的語音識(shí)別模型。支持96種語言。 Python 安裝 openai 庫后，把需要翻譯的音頻目錄放進(jìn)去，運(yùn)行程序即可生成音頻對(duì)應(yīng)的文字。以上。
2024年02月16日
瀏覽(93)
OpenAI-whisper語音識(shí)別模型
Whisper是一個(gè)通用的語音識(shí)別模型。它是在不同音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個(gè)多任務(wù)模型，可以執(zhí)行多語言語音識(shí)別、語音翻譯和語言識(shí)別。 whisper有五種模型尺寸，提供速度和準(zhǔn)確性的平衡，其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求
2024年02月09日
瀏覽(100)
chatGPT的耳朵！OpenAI的開源語音識(shí)別AI：Whisper ！
語音識(shí)別是通用人工智能的重要一環(huán)！可以說是AI的耳朵！它可以讓機(jī)器理解人類的語音，并將其轉(zhuǎn)換為文本或其他形式的輸出。語音識(shí)別的應(yīng)用場(chǎng)景非常廣泛，比如智能助理、語音搜索、語音翻譯、語音輸入等等。然而，語音識(shí)別也面臨著很多挑戰(zhàn)，比如不同的語言、口
2024年03月14日
瀏覽(26)
使用OpenAI的Whisper 模型進(jìn)行語音識(shí)別
原文：https://baijiahao.baidu.com/s?id=1756232395896695428wfr=spiderfor=pc 語音識(shí)別是人工智能中的一個(gè)領(lǐng)域，它允許計(jì)算機(jī)理解人類語音并將其轉(zhuǎn)換為文本。該技術(shù)用于 Alexa 和各種聊天機(jī)器人應(yīng)用程序等設(shè)備。而我們最常見的就是語音轉(zhuǎn)錄，語音轉(zhuǎn)錄可以語音轉(zhuǎn)換為文字記錄或字幕。
2024年02月03日
瀏覽(88)
基于OpenAI的Whisper構(gòu)建的高效語音識(shí)別模型：faster-whisper
faster-whisper是基于OpenAI的Whisper模型的高效實(shí)現(xiàn)，它利用CTranslate2，一個(gè)專為Transformer模型設(shè)計(jì)的快速推理引擎。這種實(shí)現(xiàn)不僅提高了語音識(shí)別的速度，還優(yōu)化了內(nèi)存使用效率。faster-whisper的核心優(yōu)勢(shì)在于其能夠在保持原有模型準(zhǔn)確度的同時(shí)，大幅提升處理速度，這使得它在處理
2024年02月02日
瀏覽(94)
OpenAI的人工智能語音識(shí)別模型Whisper詳解及使用
????????擁有ChatGPT語言模型的OpenAI公司，開源了 Whisper 自動(dòng)語音識(shí)別系統(tǒng)，OpenAI 強(qiáng)調(diào) Whisper 的語音識(shí)別能力已達(dá)到人類水準(zhǔn)。 ????????Whisper是一個(gè)通用的語音識(shí)別模型，它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練，能夠在英語語音識(shí)別上達(dá)到接近人類水平的魯
2024年02月09日
瀏覽(94)
【語音識(shí)別】OpenAI whisper
目錄 1. 簡(jiǎn)單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動(dòng)語音識(shí)別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用
2024年02月13日
瀏覽(90)

<label id="lvvrz"><noframes id="lvvrz">