国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

windows11 下使用 modelscope docker環(huán)境 實(shí)現(xiàn) 離線語音轉(zhuǎn)文字

這篇具有很好參考價(jià)值的文章主要介紹了windows11 下使用 modelscope docker環(huán)境 實(shí)現(xiàn) 離線語音轉(zhuǎn)文字。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

昨天看視頻 我們做了個(gè)能對話的AI派蒙,免費(fèi)給大家玩!

發(fā)現(xiàn)阿里有一個(gè)語音轉(zhuǎn)文字的模型(paraformer),之前處理這種需求一直都是直接調(diào)用服務(wù)商提供好的API接口

突然想嘗試一下本地搭建,雖然和直接調(diào)用API 沒啥區(qū)別(都不知道實(shí)現(xiàn)細(xì)節(jié)),但是這是本地化運(yùn)行,可以在內(nèi)網(wǎng)環(huán)境運(yùn)行.

因?yàn)槠匠9ぷ髦饕莏ava方向,順便記錄一些踩坑歷史.

環(huán)境安裝

參考 環(huán)境安裝
CPU環(huán)境鏡像:

docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-py37-torch1.11.0-tf1.15.5-1.5.0

GPU環(huán)境鏡像:

docker pull registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.5.0

啟動鏡像

下載后 運(yùn)行

cpu:
docker run -d --name cpu1 -v f:\docker:/work -p 9091:9090 -it --rm alicpuenv /bin/bash

gpu:
docker run -d --name gpu1 -v f:\docker:/work -p 9092:9090 --gpus all -it --rm aligpuenv /bin/bash

demo

環(huán)境搭建好了,跑示例就簡單了,官網(wǎng)提供了現(xiàn)成的demo

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

inference_pipeline = pipeline(
    task=Tasks.auto_speech_recognition,
    model='damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')

rec_result = inference_pipeline(audio_in='https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav')
print(rec_result)

直接創(chuàng)建一個(gè) demo.py 就可以運(yùn)行.

它這里會自動從網(wǎng)上下載模型,大概一個(gè)多G(只需下載一次),可能有點(diǎn)慢.

經(jīng)測試, 我的CPU(AMD Ryzen 7 3700X 8-Core Processor 3.60 GHz) 上跑這段程序(5s 左右的音頻)是 700ms 左右,GPU(RTX 2070) 是500ms 左右
windows11 下使用 modelscope docker環(huán)境 實(shí)現(xiàn) 離線語音轉(zhuǎn)文字

ps: 當(dāng)然官網(wǎng)也提供了在線的 notebook 可以直接運(yùn)行,想體驗(yàn)的同學(xué)可以直接在線運(yùn)行.

如果GPU環(huán)境報(bào)錯(cuò)

docker: Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy'
nvidia-container-cli: mount error: file creation failed: /var/lib/docker/overlay2/76aebda714a598487d6ec2615bfbc8729722e3138a846830a407d07f929128c4/merged/usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1: file exists: unknown.
ERRO[0000] error waiting for container:

可以參考 https://blog.51cto.com/u_15642578/6178468

大概步驟文章來源地址http://www.zghlxwxcb.cn/news/detail-431487.html

  1. 先不掛載gpu, 直接進(jìn)入容器, 備份兩個(gè)文件
docker run   -it --rm aligpuenv /bin/bash
mv /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1? /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1.bak
mv /usr/lib/x86_64-linux-gnu/libcuda.so.1? /usr/lib/x86_64-linux-gnu/libcuda.so.1.bak
  1. 提交鏡像修改
docker commit? xxxxxxxxxx?aligpuenv
  1. 運(yùn)行新鏡像
docker run -d --name gpu1 -v f:\docker:/work -p 9092:9090 --gpus all -it --rm aligpuenv /bin/bash

到了這里,關(guān)于windows11 下使用 modelscope docker環(huán)境 實(shí)現(xiàn) 離線語音轉(zhuǎn)文字的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • python使用VOSK實(shí)現(xiàn)離線語音識別(中文普通話)

    python使用VOSK實(shí)現(xiàn)離線語音識別(中文普通話)

    目標(biāo):一個(gè)代碼簡單,離線,可直接使用,常用語句準(zhǔn)確率還不錯(cuò),免費(fèi)的,普通話語音轉(zhuǎn)文本的工具 幾番對比下來,VSOK基本滿足我的需求,記錄一下。 環(huán)境 windows 10 / python3.8.10 s1 安裝 vosk s2 下載模型 兩個(gè)模型,一個(gè)很小,文件名中帶有small字樣,另一個(gè)就很大了,就我自

    2024年02月11日
    瀏覽(24)
  • Ubuntu20.04 使用Python實(shí)現(xiàn)全過程離線語音識別(包含語音喚醒,語音轉(zhuǎn)文字,指令識別,文字轉(zhuǎn)語音)

    ??因?yàn)槭诸^有一個(gè)項(xiàng)目,該項(xiàng)目需要在香橙派上實(shí)現(xiàn)語音控制,并且?guī)в姓Z音喚醒功能。簡單來說,就是通過喚醒詞喚醒香橙派,然后說出相關(guān)指令,香橙派去執(zhí)行指令。 ??但是,在弄香橙派的時(shí)候,自帶的麥克風(fēng)不好使了,單獨(dú)進(jìn)行麥克風(fēng)測試的時(shí)候是好使的,但是程

    2024年02月05日
    瀏覽(33)
  • 使用docker進(jìn)行nextcloud+onlyoffice環(huán)境搭建(在線 or 離線)

    使用docker進(jìn)行nextcloud+onlyoffice環(huán)境搭建(在線 or 離線)

    1.安裝 MySQL(有MySQL就可以不裝) -e MYSQL_ROOT_PASSWORD= root ? 參數(shù)是設(shè)置MySQL數(shù)據(jù)密碼,根據(jù)自己情況修改密碼,當(dāng)前設(shè)置密碼為 root 2.安裝onlyoffice服務(wù) ?3.安裝nextcloud 4.獲取onlyoffice秘鑰(用于后面nextcloud的onlyoffice插件配置) ?進(jìn)入onlyoffice容器內(nèi) ?查看秘鑰 如下圖紅框內(nèi)容即為

    2024年01月18日
    瀏覽(22)
  • 離線生成雙語字幕,一鍵生成中英雙語字幕,基于AI大模型,ModelScope

    離線生成雙語字幕,一鍵生成中英雙語字幕,基于AI大模型,ModelScope

    離線生成雙語字幕整合包,一鍵生成中英雙語字幕,基于AI大模型 制作雙語字幕的方案網(wǎng)上有很多,林林總總,不一而足。制作雙語字幕的原理也極其簡單,無非就是人聲背景音分離、語音轉(zhuǎn)文字、文字翻譯,最后就是字幕文件的合并,但美中不足之處這些環(huán)節(jié)中需要接口api的

    2024年02月21日
    瀏覽(37)
  • 瀏覽器原生JavaScript離線文字轉(zhuǎn)語音TTS播放,支持Windows自帶TTS語音和移動端(安卓、IOS)

    瀏覽器原生JavaScript離線文字轉(zhuǎn)語音TTS播放,支持Windows自帶TTS語音和移動端(安卓、IOS)

    JS已經(jīng)可以實(shí)現(xiàn)語音合成(文字轉(zhuǎn)語音)和語音識別(語音轉(zhuǎn)文字),各個(gè)瀏覽器支持列表如下所示: 語音識別支持列表: 因此,瀏覽器上面使用語音合成非常簡單。 頁面效果示例: 1、支持速度,音調(diào)設(shè)置 2、支持下拉選擇語音模板 3、文字轉(zhuǎn)語音 該文件可直接保存成htm

    2024年02月04日
    瀏覽(28)
  • 【語音識別】落地實(shí)現(xiàn)--離線智能語音助手

    【語音識別】落地實(shí)現(xiàn)--離線智能語音助手

    參考:基于python和深度學(xué)習(xí)(語音識別、NLP)實(shí)現(xiàn)本地離線智能語音控制終端(帶聊天功能和家居控制功能) 基于V3S的語音助手(三)移植pocketsphnix喚醒 基于V3S的語音助手(二)移植pyaudio到開發(fā)板 基于V3S的語音助手(一)python3的編譯和安裝(該版本解決zlib readline可

    2024年03月09日
    瀏覽(27)
  • windows10/11安裝和使用docker

    windows10/11安裝和使用docker

    ????????最近在linux服務(wù)器上使用docker安裝軟件很方便快捷,但是linux服務(wù)器是公司的需要連vpn才行,不太方便,就想著在自己windows電腦上裝一個(gè)docker玩玩(主要是方便,安裝mysql什么的幾個(gè)命令行就完事兒),當(dāng)然大家電腦配置夠用的話也可以在自己電腦上安裝linux虛擬機(jī)

    2024年02月21日
    瀏覽(24)
  • Java 離線語音識別實(shí)現(xiàn)語音轉(zhuǎn)文字

    Java 離線語音識別實(shí)現(xiàn)語音轉(zhuǎn)文字

    model下載 我們需要實(shí)現(xiàn)離線語音識別,那么就得將模型下載到本地電腦。下載地址為官網(wǎng)的 Models 模塊: https://alphacephei.com/vosk/models 我們直接找到 Chinese 分類,這里有 2 個(gè)模型 將下載的語言模型包,在下面代碼中引入 代碼 CommonUtils 注意:以上代碼只支持.wav格式的音頻文件

    2024年02月05日
    瀏覽(92)
  • windows11使用wsl2環(huán)境安裝svox2

    1. wsl --install -d ubuntu-22.04 輸入用戶名和密碼 2. 用以下命令將系統(tǒng)遷移到d盤: wsl --export ubuntu-22.04 d:ubuntuwslubuntu22.04.tar(導(dǎo)出) wsl --import ubuntu d:ubuntuwsl d:ubuntuwslubuntu22.04.tar(導(dǎo)入) wsl --unregister ubuntu-22.04(刪除原系統(tǒng)) wsl進(jìn)入新系統(tǒng) 3.安裝miniconda. 4.安裝svox2 下載:sxyu/

    2024年02月06日
    瀏覽(20)
  • C#調(diào)用科大訊飛離線語音合成實(shí)現(xiàn)文本轉(zhuǎn)語音

    C#調(diào)用科大訊飛離線語音合成實(shí)現(xiàn)文本轉(zhuǎn)語音

    文本轉(zhuǎn)語音(Text To Speech),簡稱TTS,在很多業(yè)務(wù)場景會用到,比如廣播大廳,人機(jī)互動等。C#要實(shí)現(xiàn)TTS有不少選擇,比如調(diào)用System.Speech,此處就不細(xì)說了,下面主要介紹一下C#調(diào)用科大訊飛的離線語音合成SDK來實(shí)現(xiàn)文本轉(zhuǎn)語音。 地址:[https://www.xfyun.cn/service/offline_tts] 一、創(chuàng)建

    2024年02月12日
    瀏覽(18)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包