1、安裝Python
Python的安裝很簡(jiǎn)單,點(diǎn)擊這里進(jìn)行下載。
安裝完成之后,輸入python -V可以看到版本信息,說明已經(jīng)安裝成功了。
如果輸入python -V命令沒有看到上面的這樣的信息,要么是安裝失敗,要么是安裝好之后沒有自動(dòng)配置環(huán)境變量,如何配置環(huán)境變量可以從網(wǎng)上搜索。
Python的具體安裝過程可以參考這篇文章。
2、安裝FFmpeg
ffmpeg是專門做音視頻處理用的軟件,并且是開源的,點(diǎn)擊這里進(jìn)行下載
安裝過程也是十分的簡(jiǎn)單,具體安裝過程可以到網(wǎng)上搜索,因?yàn)槲疫@里已經(jīng)安裝過了,所以沒辦法重新演示安裝過程。
這里需要注意,我們安裝完成之后還需要配置環(huán)境變量。
2.1、配置環(huán)境變量
如何配置環(huán)境變量,這里以Windows 11為例。
首先右擊桌面上的“此電腦”,然后點(diǎn)擊“屬性”,然后點(diǎn)擊“高級(jí)系統(tǒng)設(shè)置”,然后點(diǎn)擊“環(huán)境變量”,然后點(diǎn)擊“系統(tǒng)變量”中的“Path”,然后雙擊"Path"進(jìn)入到設(shè)置"Path"窗口,然后點(diǎn)擊“新建”,然后把你安裝FFmpeg的位置寫上,注意寫到bin目錄,最后記得點(diǎn)擊“確定”。
3、安裝顯卡驅(qū)動(dòng)
如過你沒有獨(dú)立顯卡,那么可以跳過這步。如果你使用的是AMD顯卡,那你也可以跳過這步了。
這里我以NVIDIA顯卡為例。
我自己電腦上的顯卡是NVIDIA MX150 2GB顯卡,所以我們安裝驅(qū)動(dòng)的時(shí)候也要選擇與自己顯卡類型一致的驅(qū)動(dòng)。
點(diǎn)擊這里下載顯卡驅(qū)動(dòng)
選擇完成之后,點(diǎn)擊“搜索”按鈕,就可以看到有哪些可以下載的顯卡驅(qū)動(dòng)了,最后點(diǎn)擊下載。
下載到本地之后,運(yùn)行安裝程序即可。
3.1、安裝CUDA
安裝完顯卡驅(qū)動(dòng)之后,我們打開顯卡控制面板,找到顯卡的信息,查看你顯卡支持的CUDA版本。
可以看到我這里是12.1版本。
然后我們可以去官網(wǎng)下載對(duì)應(yīng)版本的CUDA了,點(diǎn)擊這里去下載
你要根據(jù)自己使用的系統(tǒng)來選擇。
下載完成之后,直接雙擊運(yùn)行即可。
這里比較大,為了下載更快,我使用了多線程下載器IDM。
這里再提一句,我們一定要下載對(duì)應(yīng)版本的CUDA。
運(yùn)行之后,可以選擇自己安裝的位置。
選擇自定義安裝,然后把前面兩個(gè)勾選上。
然后是選擇安裝的位置。
然后你可能會(huì)安裝失敗。
我在安裝過程中就有一個(gè)沒有安裝成功,我們可以不管它。
我們打開cmd命令行窗口,然后輸入nvcc --version回車之后看到下面這些信息,說明安裝成功了。
如果你們不懂,可以看參考文章。
如果有需要的話,最好還要安裝一下cuDNN。這里我就不安裝了。具體可以參考這篇文章。
4、安裝PyTorch
簡(jiǎn)介:PyTorch是一個(gè)開源的Python機(jī)器學(xué)習(xí)庫,其前身是著名的機(jī)器學(xué)習(xí)庫Torch。2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch,它是一個(gè)面向Python語言的深度學(xué)習(xí)框架,不僅能夠?qū)崿F(xiàn)強(qiáng)大的GPU加速,同時(shí)還支持動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò),這是很多主流深度學(xué)習(xí)框架比如Tensorflow等都不支持的。PyTorch既可以看作加入了GPU支持的numpy,同時(shí)也可以看成一個(gè)擁有自動(dòng)求導(dǎo)功能的強(qiáng)大的深度神經(jīng)網(wǎng)絡(luò)。除了Facebook外,它已經(jīng)被Twitter、CMU和Salesforce等機(jī)構(gòu)采用。作為經(jīng)典機(jī)器學(xué)習(xí)庫Torch的端口,PyTorch 為 Python 語言使用者提供了舒適的深度學(xué)習(xí)開發(fā)選擇。
點(diǎn)擊這里下載PyTorch
這里說明一下,下載的PyTorch要與CUDA的版本一致,我這里使用的CUDA版本是12.1,但是我在官方PyTorch中沒有找到該版本的下載命令。然后我是從網(wǎng)上找到一個(gè)命令安裝了PyTorch。
pip --trusted-host pypi.tuna.tsinghua.edu.cn install torch==1.10.1+cu102 torchvision==0.11.2+cu102 torchaudio==0.10.1 -f https://download.pytorch.org/whl/torch_stable.html
安裝完成之后可以進(jìn)入python環(huán)境,如果輸入import torch沒有報(bào)錯(cuò),說明就可以了。
import torch
print(torch.__version__)
print(torch.cuda.is_available())
不過這里還是推薦大家下載與自己CUDA對(duì)應(yīng)的版本。
如果你覺得我寫的不夠具體,可以參考這篇文章。
5、安裝whisper
安裝whisper很簡(jiǎn)單,直接用一條命令即可。
pip install -U openai-whisper
不過使用這條命令安裝會(huì)很慢,我們可以使用清華鏡像。
pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple
6、whisper的使用
安裝好后,我們使用下面的命令可以查看whisper如何使用。
whisper -h
我們現(xiàn)在就可以使用whisper來語音識(shí)別了。
whisper test.mp3 --model small --language Chinese
這里我們使用small模型,語言是中文,這樣我們就可以把test.mp3音頻文件轉(zhuǎn)為文本并輸出了。
我們可以指定輸出的格式,默認(rèn)是輸出所有格式文件。
--output_format {txt,vtt,srt,tsv,json,all}
我們也可以直接傳入視頻來識(shí)別音頻生成文件。
whisper test.mp4 --model small --output_format srt --language Chinese
如果你的顯存不過用會(huì)報(bào)下面的錯(cuò)誤。
RuntimeError: CUDA out of memory. Tried to allocate 226.00 MiB (GPU 0; 2.00 GiB total capacity;
1.34 GiB already allocated; 0 bytes free; 1.60 GiB reserved in total by PyTorch) If reserved
memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.
See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
這個(gè)時(shí)候我們不要慌,我們還可以使用CPU,默認(rèn)是使用GPU的,我們可以通過參數(shù)--device
來指定使用CPU進(jìn)行運(yùn)算。
whisper test.mp4 --model small --output_format srt --device cpu --language Chinese
我們可以省略--language Chinese
,這個(gè)時(shí)候可以自動(dòng)識(shí)別出你音頻的語言。
當(dāng)我們使用CPU運(yùn)算時(shí),我們還可以指定使用的線程數(shù)量。
whisper test.mp4 --model small --output_format srt --device cpu --language Chinese --threads 8
7、總結(jié)
whisper對(duì)硬件的要不是很高,如果沒有獨(dú)顯,也可以使用CPU來運(yùn)行,但是使用CPU的運(yùn)算算力不及GPU強(qiáng)。
寫本篇文章主要是記錄一下在本地安裝whisper的過程。在安裝過程遇到很多坑,這里記錄一下,一則方便自己日后再次安裝,二是方便看這篇文章的你。
8、源碼下載
點(diǎn)擊這里下載源碼文章來源:http://www.zghlxwxcb.cn/news/detail-477687.html
9、視頻教程
點(diǎn)擊這里查看視頻內(nèi)容文章來源地址http://www.zghlxwxcb.cn/news/detail-477687.html
到了這里,關(guān)于OpenAI開源語音識(shí)別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!