1 簡(jiǎn)介
Whisper 是 OpenAI 的語(yǔ)音識(shí)別系統(tǒng)(幾乎是最先進(jìn)),它是免費(fèi)的開(kāi)源模型,可供本地部署。
2 docker
https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice
3 github
https://github.com/ahmetoner/whisper-asr-webservice文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-751788.html
4 運(yùn)行
nvidia-docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu
image 大小:11.5G
運(yùn)行后,即可在9000端口通過(guò)swagger調(diào)用,我先用手機(jī)錄了一些簡(jiǎn)單的中文,識(shí)別效果還不錯(cuò),除了第一次調(diào)用時(shí)可能是下載和加載模型時(shí)間比較長(zhǎng),后面再調(diào)用速度就很快。
又用它識(shí)別了一個(gè)25分鐘的mp3(約27M),是一位小哥哥B站視頻對(duì)應(yīng)的音頻文件,識(shí)別時(shí)間約為不到1分鐘,使用GPU內(nèi)存占用在1G之內(nèi),盡管有一小部分亂碼和一些重復(fù),但整體效果不錯(cuò)。
我覺(jué)得速度和效果都相當(dāng)美麗,絕對(duì)可以作為一些收費(fèi)產(chǎn)品的平替了~~文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-751788.html
5 注意事項(xiàng)
- 上傳的音頻文件使用時(shí)盡量不要用中文文件名
到了這里,關(guān)于本地部署_語(yǔ)音識(shí)別工具_(dá)Whisper的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!