国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<sub id="zhwjz"><thead id="zhwjz"><li id="zhwjz"></li></thead></sub>

<table id="zhwjz"><font id="zhwjz"></font></table>

whisperX 語音識別本地部署

2年前作者：JoeManba分類：Toy博客閱讀(22)違法舉報

這篇具有很好參考價值的文章主要介紹了whisperX 語音識別本地部署。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

WhisperX 是一個優(yōu)秀的開源Python語音識別庫。
下面記錄Windows10系統(tǒng)下部署Whisper
1、在操作系統(tǒng)中安裝 Python環(huán)境
2、安裝 CUDA環(huán)境
3、安裝Annaconda或Minconda環(huán)境
4、下載安裝ffmpeg
下載release-builds包，如下圖所示
whisperX 語音識別本地部署,語音識別,python,人工智能
將下載的包解壓到你想要的路徑，然后配置系統(tǒng)環(huán)境：我的電腦->高級系統(tǒng)設(shè)置->環(huán)境變量->Path

設(shè)置完成后打開cmd窗口輸入

ffmpeg

whisperX 語音識別本地部署,語音識別,python,人工智能
5、conda環(huán)境安裝指定位置的虛擬環(huán)境

conda create --prefix=D:\Projects\LiimouDemo\WhisperX\Code\whisperX\whisperXVenv python=3.10

6、激活虛擬環(huán)境

conda activate D:\Projects\LiimouDemo\WhisperX\Code\whisperX\whisperXVenv

7、安裝WhisperX庫

pip install git+https://github.com/m-bain/whisperx.git

8、更新WhisperX庫

pip install git+https://github.com/m-bain/whisperx.git --upgrade

9、在Python中使用

import whisperx
import time
import zhconv
device = "cuda"
audio_file = "data/test.mp3"
batch_size = 16 # reduce if low on GPU mem
compute_type = "float16" # change to "int8" if low on GPU mem (may reduce accuracy)
# compute_type = "int8" # change to "int8" if low on GPU mem (may reduce accuracy)
print('開始加載模型')
start = time.time()
# 1. Transcribe with original whisper (batched)
model = whisperx.load_model("large-v2", device, compute_type=compute_type)
# model = whisperx.load_model("small", device, compute_type=compute_type)
end = time.time()
print('加載使用的時間：',end-start,'s')
start = time.time()
audio = whisperx.load_audio(audio_file)
result = model.transcribe(audio, batch_size=batch_size)

print(result["segments"][0]["text"]) # before alignment
end = time.time()
print('識別使用的時間：',end-start,'s')

封裝上述代碼，初始化時調(diào)用一次loadModel()方法，之后使用就直接調(diào)用asr(path)方法

import whisperx
import zhconv
from whisperx.asr import FasterWhisperPipeline
import time

class WhisperXTool:
    device = "cuda"
    audio_file = "data/test.mp3"
    batch_size = 16  # reduce if low on GPU mem
    compute_type = "float16"  # change to "int8" if low on GPU mem (may reduce accuracy)
    # compute_type = "int8" # change to "int8" if low on GPU mem (may reduce accuracy)
    fast_model: FasterWhisperPipeline

    def loadModel(self):
        # 1. Transcribe with original whisper (batched)
        self.fast_model = whisperx.load_model("large-v2", self.device, compute_type=self.compute_type)
        print("模型加載完成")

    def asr(self, filePath: str):
        start = time.time()
        audio = whisperx.load_audio(filePath)
        result = self.fast_model.transcribe(audio, batch_size=self.batch_size)
        s = result["segments"][0]["text"]
        s1 = zhconv.convert(s, 'zh-cn')
        print(s1)
        end = time.time()
        print('識別使用的時間：', end - start, 's')
        return s1

zhconv是中文簡體繁體轉(zhuǎn)換的庫，安裝命令如下文章來源地址http://www.zghlxwxcb.cn/news/detail-568326.html

pip install zhconv

到了這里，關(guān)于whisperX 語音識別本地部署的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

語音識別與VC維：改變?nèi)斯ぶ悄艿奈磥?/a>
語音識別(Speech Recognition)是一種人工智能技術(shù)，它旨在將人類的語音信號轉(zhuǎn)換為文本或其他形式的數(shù)據(jù)。這項(xiàng)技術(shù)在過去幾年中得到了巨大的發(fā)展，并成為人工智能領(lǐng)域的一個關(guān)鍵技術(shù)。VC維(Vocabulary Coverage Dimension)是一種數(shù)學(xué)模型，用于描述語言模型的表達(dá)能力。在本文中，
2024年02月19日
瀏覽(22)
人工智能-語音識別技術(shù)paddlespeech的搭建和使用
PaddleSpeech是百度飛槳（PaddlePaddle）開源深度學(xué)習(xí)平臺的其中一個項(xiàng)目，它基于飛槳的語音方向模型庫，用于語音和音頻中的各種關(guān)鍵任務(wù)的開發(fā)，包含大量基于深度學(xué)習(xí)前沿和有影響力的模型。PaddleSpeech支持語音識別、語音翻譯（英譯中）、語音合成、標(biāo)點(diǎn)恢復(fù)等應(yīng)用示例。
2024年02月02日
瀏覽(27)
智能語音識別在人工智能應(yīng)用中的重要性
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 隨著計(jì)算機(jī)的發(fā)展、移動互聯(lián)網(wǎng)的普及和互聯(lián)網(wǎng)服務(wù)的快速發(fā)展，語音識別技術(shù)也逐漸走入人們的視野中。相對于手寫文字或是拼音方式輸入的方式，語音輸入的方式帶來的便利、準(zhǔn)確率提高的效果，使得越來越多的人開始喜歡用語音的方式來
2024年02月07日
瀏覽(34)
構(gòu)建基于AWSLambda的人工智能應(yīng)用：語音識別、圖像識別和自然語言處理
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 在人工智能領(lǐng)域，用大數(shù)據(jù)、機(jī)器學(xué)習(xí)等方法來解決復(fù)雜的問題，已經(jīng)成為越來越多企業(yè)和開發(fā)者關(guān)注的問題。但是，如何把這些方法落地到生產(chǎn)環(huán)境中，仍然是一個難題。隨著云計(jì)算平臺的廣泛普及，AWS Lambda作為一項(xiàng)服務(wù)正在成為各個公司
2024年02月09日
瀏覽(36)
OpenAI的人工智能語音識別模型Whisper詳解及使用
????????擁有ChatGPT語言模型的OpenAI公司，開源了 Whisper 自動語音識別系統(tǒng)，OpenAI 強(qiáng)調(diào) Whisper 的語音識別能力已達(dá)到人類水準(zhǔn)。 ????????Whisper是一個通用的語音識別模型，它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練，能夠在英語語音識別上達(dá)到接近人類水平的魯
2024年02月09日
瀏覽(90)
人工智能技術(shù)在智能音箱中的應(yīng)用：智能語音識別與智能交互
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 引言 1.1. 背景介紹智能音箱作為智能家居的重要組成部分，近年來得到了越來越多的用戶青睞。隨著人工智能技術(shù)的不斷發(fā)展，智能音箱的核心功能之一——智能語音識別與智能交互也越來越受到人們的關(guān)注。智能語音識別技術(shù)可以讓用戶更
2024年02月07日
瀏覽(28)
極速進(jìn)化,光速轉(zhuǎn)錄,C++版本人工智能實(shí)時語音轉(zhuǎn)文字(字幕/語音識別)Whisper.cpp實(shí)踐
業(yè)界良心OpenAI開源的Whisper模型是開源語音轉(zhuǎn)文字領(lǐng)域的執(zhí)牛耳者，白璧微瑕之處在于無法通過蘋果M芯片優(yōu)化轉(zhuǎn)錄效率，Whisper.cpp 則是 Whisper 模型的 C/C++ 移植版本，它具有無依賴項(xiàng)、內(nèi)存使用量低等特點(diǎn)，重要的是增加了 Core ML 支持，完美適配蘋果M系列芯片。 Whisper.cpp的張量
2024年02月02日
瀏覽(28)
Whisper JAX 語音識別本地部署
https://nlpcloud.com/zh/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html whisper-jax最詳細(xì)的安裝教程 | 一個號稱比whisper快70倍的語音識別項(xiàng)目 | 免費(fèi)開源的語音識別項(xiàng)目 whisperX 語音識別本地部署_JoeManba的博客-CSDN博客 GitHub - sanchit-gandhi/whisper-jax: JAX implement
2024年02月08日
瀏覽(20)
本地部署_語音識別工具_(dá)Whisper
1 簡介 Whisper 是 OpenAI 的語音識別系統(tǒng)（幾乎是最先進(jìn)），它是免費(fèi)的開源模型，可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice 3 github https://github.com/ahmetoner/whisper-asr-webservice 4 運(yùn)行 image 大?。?1.5G 運(yùn)行后，即可在9000端口通過swagger調(diào)用，我先用手機(jī)錄
2024年02月05日
瀏覽(23)
【Elsevier旗下】1區(qū)SCI，5天見刊！穩(wěn)定檢索36年，大數(shù)據(jù)、人工智能、機(jī)器學(xué)習(xí)、語音、語言、會話、情緒識別等領(lǐng)域
近日國自然預(yù)計(jì)將在下周8月20日之前公布，想必申請過國自然基金作者都知道，需要有研究基礎(chǔ)，說白了就是需要有文章支持。那么稿子寫好了，選擇一本靠譜優(yōu)質(zhì)期刊也是一門學(xué)問。本期小編推薦2本Elsevier 旗下審稿快刊，各項(xiàng)指標(biāo)優(yōu)秀，實(shí)為評職晉升、申報基金之首選
2024年02月13日
瀏覽(17)

<ul id="dwibp"></ul>

<sub id="dwibp"></sub>