国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

windows11 下使用 modelscope docker環(huán)境實(shí)現(xiàn) 離線語音轉(zhuǎn)文字

2年前作者：mysgk分類：Toy博客閱讀(23)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了windows11 下使用 modelscope docker環(huán)境實(shí)現(xiàn) 離線語音轉(zhuǎn)文字。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

昨天看視頻我們做了個(gè)能對話的AI派蒙，免費(fèi)給大家玩！

發(fā)現(xiàn)阿里有一個(gè)語音轉(zhuǎn)文字的模型(paraformer),之前處理這種需求一直都是直接調(diào)用服務(wù)商提供好的API接口

突然想嘗試一下本地搭建,雖然和直接調(diào)用API 沒啥區(qū)別(都不知道實(shí)現(xiàn)細(xì)節(jié)),但是這是本地化運(yùn)行,可以在內(nèi)網(wǎng)環(huán)境運(yùn)行.

因?yàn)槠匠９ぷ髦饕莏ava方向,順便記錄一些踩坑歷史.

環(huán)境安裝

參考環(huán)境安裝
CPU環(huán)境鏡像：

docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-py37-torch1.11.0-tf1.15.5-1.5.0

GPU環(huán)境鏡像：

docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.5.0

啟動鏡像

下載后運(yùn)行

cpu:
docker run -d --name cpu1 -v f:\docker:/work -p 9091:9090 -it --rm alicpuenv /bin/bash

gpu:
docker run -d --name gpu1 -v f:\docker:/work -p 9092:9090 --gpus all -it --rm aligpuenv /bin/bash

demo

環(huán)境搭建好了,跑示例就簡單了,官網(wǎng)提供了現(xiàn)成的demo

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

inference_pipeline = pipeline(
    task=Tasks.auto_speech_recognition,
    model='damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')

rec_result = inference_pipeline(audio_in='https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav')
print(rec_result)

直接創(chuàng)建一個(gè) demo.py 就可以運(yùn)行.

它這里會自動從網(wǎng)上下載模型,大概一個(gè)多G(只需下載一次),可能有點(diǎn)慢.

經(jīng)測試, 我的CPU(AMD Ryzen 7 3700X 8-Core Processor 3.60 GHz) 上跑這段程序(5s 左右的音頻)是 700ms 左右,GPU(RTX 2070) 是500ms 左右
windows11 下使用 modelscope docker環(huán)境實(shí)現(xiàn) 離線語音轉(zhuǎn)文字

ps: 當(dāng)然官網(wǎng)也提供了在線的 notebook 可以直接運(yùn)行,想體驗(yàn)的同學(xué)可以直接在線運(yùn)行.

如果GPU環(huán)境報(bào)錯(cuò)

docker: Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: mount error: file creation failed: /var/lib/docker/overlay2/76aebda714a598487d6ec2615bfbc8729722e3138a846830a407d07f929128c4/merged/usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1: file exists: unknown.
ERRO[0000] error waiting for container:

可以參考 https://blog.51cto.com/u_15642578/6178468

大概步驟文章來源地址http://www.zghlxwxcb.cn/news/detail-431487.html

先不掛載gpu, 直接進(jìn)入容器, 備份兩個(gè)文件

docker run   -it --rm aligpuenv /bin/bash
mv /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1? /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1.bak
mv /usr/lib/x86_64-linux-gnu/libcuda.so.1? /usr/lib/x86_64-linux-gnu/libcuda.so.1.bak

提交鏡像修改

docker commit? xxxxxxxxxx?aligpuenv

運(yùn)行新鏡像

docker run -d --name gpu1 -v f:\docker:/work -p 9092:9090 --gpus all -it --rm aligpuenv /bin/bash

到了這里，關(guān)于windows11 下使用 modelscope docker環(huán)境實(shí)現(xiàn) 離線語音轉(zhuǎn)文字的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

python使用VOSK實(shí)現(xiàn)離線語音識別（中文普通話）
目標(biāo)：一個(gè)代碼簡單，離線，可直接使用，常用語句準(zhǔn)確率還不錯(cuò)，免費(fèi)的，普通話語音轉(zhuǎn)文本的工具幾番對比下來，VSOK基本滿足我的需求，記錄一下。環(huán)境 windows 10 / python3.8.10 s1 安裝 vosk s2 下載模型兩個(gè)模型，一個(gè)很小，文件名中帶有small字樣，另一個(gè)就很大了，就我自
2024年02月11日
瀏覽(24)
Ubuntu20.04 使用Python實(shí)現(xiàn)全過程離線語音識別（包含語音喚醒，語音轉(zhuǎn)文字，指令識別，文字轉(zhuǎn)語音）
??因?yàn)槭诸^有一個(gè)項(xiàng)目，該項(xiàng)目需要在香橙派上實(shí)現(xiàn)語音控制，并且?guī)в姓Z音喚醒功能。簡單來說，就是通過喚醒詞喚醒香橙派，然后說出相關(guān)指令，香橙派去執(zhí)行指令。 ??但是，在弄香橙派的時(shí)候，自帶的麥克風(fēng)不好使了，單獨(dú)進(jìn)行麥克風(fēng)測試的時(shí)候是好使的，但是程
2024年02月05日
瀏覽(33)
使用docker進(jìn)行nextcloud+onlyoffice環(huán)境搭建（在線 or 離線）
1.安裝 MySQL（有MySQL就可以不裝） -e MYSQL_ROOT_PASSWORD= root ? 參數(shù)是設(shè)置MySQL數(shù)據(jù)密碼，根據(jù)自己情況修改密碼，當(dāng)前設(shè)置密碼為 root 2.安裝onlyoffice服務(wù) ?3.安裝nextcloud 4.獲取onlyoffice秘鑰（用于后面nextcloud的onlyoffice插件配置） ?進(jìn)入onlyoffice容器內(nèi) ?查看秘鑰如下圖紅框內(nèi)容即為
2024年01月18日
瀏覽(22)
離線生成雙語字幕,一鍵生成中英雙語字幕,基于AI大模型,ModelScope
離線生成雙語字幕整合包,一鍵生成中英雙語字幕,基于AI大模型制作雙語字幕的方案網(wǎng)上有很多，林林總總，不一而足。制作雙語字幕的原理也極其簡單，無非就是人聲背景音分離、語音轉(zhuǎn)文字、文字翻譯，最后就是字幕文件的合并，但美中不足之處這些環(huán)節(jié)中需要接口api的
2024年02月21日
瀏覽(37)
瀏覽器原生JavaScript離線文字轉(zhuǎn)語音TTS播放，支持Windows自帶TTS語音和移動端（安卓、IOS）
JS已經(jīng)可以實(shí)現(xiàn)語音合成（文字轉(zhuǎn)語音）和語音識別（語音轉(zhuǎn)文字），各個(gè)瀏覽器支持列表如下所示：語音識別支持列表：因此，瀏覽器上面使用語音合成非常簡單。頁面效果示例： 1、支持速度，音調(diào)設(shè)置 2、支持下拉選擇語音模板 3、文字轉(zhuǎn)語音該文件可直接保存成htm
2024年02月04日
瀏覽(28)
【語音識別】落地實(shí)現(xiàn)--離線智能語音助手
參考：基于python和深度學(xué)習(xí)（語音識別、NLP）實(shí)現(xiàn)本地離線智能語音控制終端（帶聊天功能和家居控制功能）基于V3S的語音助手（三）移植pocketsphnix喚醒基于V3S的語音助手（二）移植pyaudio到開發(fā)板基于V3S的語音助手（一）python3的編譯和安裝（該版本解決zlib readline可
2024年03月09日
瀏覽(27)
windows10/11安裝和使用docker
????????最近在linux服務(wù)器上使用docker安裝軟件很方便快捷，但是linux服務(wù)器是公司的需要連vpn才行，不太方便，就想著在自己windows電腦上裝一個(gè)docker玩玩（主要是方便，安裝mysql什么的幾個(gè)命令行就完事兒），當(dāng)然大家電腦配置夠用的話也可以在自己電腦上安裝linux虛擬機(jī)
2024年02月21日
瀏覽(24)
Java 離線語音識別實(shí)現(xiàn)語音轉(zhuǎn)文字
model下載我們需要實(shí)現(xiàn)離線語音識別，那么就得將模型下載到本地電腦。下載地址為官網(wǎng)的 Models 模塊： https://alphacephei.com/vosk/models 我們直接找到 Chinese 分類，這里有 2 個(gè)模型將下載的語言模型包，在下面代碼中引入代碼 CommonUtils 注意：以上代碼只支持.wav格式的音頻文件
2024年02月05日
瀏覽(92)
windows11使用wsl2環(huán)境安裝svox2
1. wsl --install -d ubuntu-22.04 輸入用戶名和密碼 2. 用以下命令將系統(tǒng)遷移到d盤： wsl --export ubuntu-22.04 d:ubuntuwslubuntu22.04.tar（導(dǎo)出） wsl --import ubuntu d:ubuntuwsl d:ubuntuwslubuntu22.04.tar（導(dǎo)入） wsl --unregister ubuntu-22.04（刪除原系統(tǒng)） wsl進(jìn)入新系統(tǒng) 3.安裝miniconda. 4.安裝svox2 下載：sxyu/
2024年02月06日
瀏覽(20)
C#調(diào)用科大訊飛離線語音合成實(shí)現(xiàn)文本轉(zhuǎn)語音
文本轉(zhuǎn)語音(Text To Speech)，簡稱TTS，在很多業(yè)務(wù)場景會用到，比如廣播大廳，人機(jī)互動等。C#要實(shí)現(xiàn)TTS有不少選擇，比如調(diào)用System.Speech，此處就不細(xì)說了，下面主要介紹一下C#調(diào)用科大訊飛的離線語音合成SDK來實(shí)現(xiàn)文本轉(zhuǎn)語音。地址：[https://www.xfyun.cn/service/offline_tts] 一、創(chuàng)建
2024年02月12日
瀏覽(18)