目錄
環(huán)境配置
代碼實現(xiàn)
******? 實現(xiàn) .mp4轉(zhuǎn)換為 .wav文件,識別后進(jìn)行關(guān)鍵詞匹配并輸出關(guān)鍵詞出現(xiàn)的次數(shù)
******? 完整代碼實現(xiàn)請私信
環(huán)境配置
安裝 ffmpeg
- 打開網(wǎng)址? ?https://github.com/BtbN/FFmpeg-Builds/releases
- 下載如下圖所示的文件
- 下載后解壓
?我的路徑是G:\ffmpeg-master-latest-win64-gpl-shared\bin
找到自己的安裝路徑,進(jìn)入到 bin 目錄,復(fù)制這個路徑
- 在我的電腦中添加環(huán)境變量
右擊 ---> 屬性
?高級系統(tǒng)設(shè)置
?環(huán)境變量
?找到 path,雙擊
新建 --->? 把剛剛的路徑粘貼進(jìn)來,確定
在搜索框中輸入 cmd ,打開終端,輸入 ffmpeg -version,顯示如下則表示安裝成功
安裝 opencc庫
pip install opencc -i https://pypi.tuna.tsinghua.edu.cn/simple
安裝 torch
pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
注:若運行時報關(guān)于 numpy 的錯誤,需要執(zhí)行下面這個命令,更新 numpy 庫文章來源:http://www.zghlxwxcb.cn/news/detail-543735.html
pip install numpy --upgrade
代碼實現(xiàn)
只展示核心,完整的請關(guān)注并私信文章來源地址http://www.zghlxwxcb.cn/news/detail-543735.html
# 利用訓(xùn)練好的模型進(jìn)行識別
result = whisper_model.transcribe('錄音.wav')
到了這里,關(guān)于OpenAI開源??!Whisper語音識別實戰(zhàn)!!【環(huán)境配置+代碼實現(xiàn)】的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!