国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

AI語音識別模塊--whisper模塊

這篇具有很好參考價值的文章主要介紹了AI語音識別模塊--whisper模塊。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

1.下載 ffmpeg,挑一個自己電腦系統(tǒng)的版本,下載,如我win64:

地址:

Releases · BtbN/FFmpeg-Builds · GitHub

下載壓縮包zip,到·本地

解壓安裝,其實無需安裝,只需把對應的目錄下的bin,

編輯環(huán)境變量的path,添加到環(huán)境變量即可!?。?/p>

不能科學的同學,可以到網(wǎng)盤地址,下載壓縮包zip

鏈接:https://pan.baidu.com/s/1yBQBs-pUKOpUPeIJpPsURA?pwd=6543?
提取碼:6543?

2.下載whisper:

查看模型的地址:? ? ? ? ? ? ? https://github.com/openai/whisper/blob/main/whisper/__init__.py? ? ??

查看初始化文件: __init__,內含各個模型的地址,就省得取hugging-face里下載了...

AI語音識別模塊--whisper模塊,人工智能,語音識別

例如,依次從小到大...配置要求如下:

AI語音識別模塊--whisper模塊,人工智能,語音識別

地址:::

?"tiny"最小化模型: "https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt",

"base"基礎款模型: "https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt",

?"small"小型化模型: "https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt",

3.根據(jù) tree/main分支下,進行環(huán)境的配置::

地址:

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

下滑到底下,即可看到

AI語音識別模塊--whisper模塊,人工智能,語音識別

安裝好后,直接是cpu版本的pytorch,如若需要gpu版本,可自行安裝....

pip uninstall torch,再 pip install 自己gpu版本的torch即可?。?!...

4.運用命令:

whisper test.mp3 --model small --model_dir?D:\qbroDownload\whisper-model --language Chinese

#?whisper 音頻文件?

--model 模型規(guī)格?

--model_dir?模型路徑

--language 語言選擇/可不選....提前選好可加速..

產(chǎn)生報錯:::

transcribe.py:115: UserWarning: FP16 is not supported on CPU; using FP32 instead

5.詳情代碼::

可作為參考....文章來源地址http://www.zghlxwxcb.cn/news/detail-830901.html

import whisper
# 有下載到本地,直接加載 base.pt也可以,不然會直接網(wǎng)絡下載
model = whisper.load_model('base')

# 1.傳入音頻、fp16-cpu版本,gpu版本可以忽略,語言可選項...默認繁體字,用base模型,輸出簡體字...
result = model.transcribe('./op.wav',fp16=False,language='Chinese')
print(result['text'])

# 2.傳入視頻也可以...
result1 = model.result = model.transcribe('./video.mp4',fp16=False,language='Chinese')
print(result1['text'])

到了這里,關于AI語音識別模塊--whisper模塊的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 人工智能技術在智能音箱中的應用:智能語音識別與智能交互

    作者:禪與計算機程序設計藝術 引言 1.1. 背景介紹 智能音箱作為智能家居的重要組成部分,近年來得到了越來越多的用戶青睞。隨著人工智能技術的不斷發(fā)展,智能音箱的核心功能之一——智能語音識別與智能交互也越來越受到人們的關注。智能語音識別技術可以讓用戶更

    2024年02月07日
    瀏覽(31)
  • 第14章-Python-人工智能-語言識別-調用百度語音識別

    第14章-Python-人工智能-語言識別-調用百度語音識別

    ? ? ? ? 百度語音識別API是可以免費試用的,通過百度賬號登錄到百度智能云,在語音技術頁面創(chuàng)建的應用,生成一個語音識別的應用,這個應用會給你一個APIKey和一個Secret Key,如圖14.1所示。 ?我們在自己的程序中用 API Key 和 Secret Key 這兩個值獲取 Koken,然后再通過 Token 調

    2024年02月08日
    瀏覽(103)
  • 語音識別與VC維:改變人工智能的未來

    語音識別(Speech Recognition)是一種人工智能技術,它旨在將人類的語音信號轉換為文本或其他形式的數(shù)據(jù)。這項技術在過去幾年中得到了巨大的發(fā)展,并成為人工智能領域的一個關鍵技術。VC維(Vocabulary Coverage Dimension)是一種數(shù)學模型,用于描述語言模型的表達能力。在本文中,

    2024年02月19日
    瀏覽(25)
  • 【人工智能】科大訊飛語音識別應用開發(fā)(第三集)

    【人工智能】科大訊飛語音識別應用開發(fā)(第三集)

    這次需要對科大訊飛語音識別接口進行語音識別應用開發(fā),前兩次都是通過WebAPI調用接口,這次換一下,通過SDK調用接口 下面是開發(fā)的詳細記錄過程(基于前兩次的基礎上) 網(wǎng)址:https://www.xfyun.cn/services/voicedictation 不領服務量為500且該包免費( 貌似是不同應用都可以免費領

    2024年02月13日
    瀏覽(22)
  • 人工智能-語音識別技術paddlespeech的搭建和使用

    PaddleSpeech是百度飛槳(PaddlePaddle)開源深度學習平臺的其中一個項目,它基于飛槳的語音方向模型庫,用于語音和音頻中的各種關鍵任務的開發(fā),包含大量基于深度學習前沿和有影響力的模型。PaddleSpeech支持語音識別、語音翻譯(英譯中)、語音合成、標點恢復等應用示例。

    2024年02月02日
    瀏覽(29)
  • 構建基于AWSLambda的人工智能應用:語音識別、圖像識別和自然語言處理

    作者:禪與計算機程序設計藝術 在人工智能領域,用大數(shù)據(jù)、機器學習等方法來解決復雜的問題,已經(jīng)成為越來越多企業(yè)和開發(fā)者關注的問題。但是,如何把這些方法落地到生產(chǎn)環(huán)境中,仍然是一個難題。 隨著云計算平臺的廣泛普及,AWS Lambda作為一項服務正在成為各個公司

    2024年02月09日
    瀏覽(36)
  • AI人工智能課題:圖像識別貨幣識別系統(tǒng)的設計與實現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學生畢業(yè)設計教育和輔導。 所有項目都配有從入門到精通的基礎知識視頻課程,免費 項目配有對應開發(fā)文檔、開題報告、任務書、

    2024年02月04日
    瀏覽(97)
  • AI人工智能課題:圖像識別菜品識別系統(tǒng)的設計與實現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學生畢業(yè)設計教育和輔導。 所有項目都配有從入門到精通的基礎知識視頻課程,免費 項目配有對應開發(fā)文檔、開題報告、任務書、

    2024年02月03日
    瀏覽(28)
  • AI人工智能課題:圖像識別紅酒識別系統(tǒng)的設計與實現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學生畢業(yè)設計教育和輔導。 所有項目都配有從入門到精通的基礎知識視頻課程,免費 項目配有對應開發(fā)文檔、開題報告、任務書、

    2024年02月04日
    瀏覽(33)
  • AI人工智能課題:圖像識別地標識別系統(tǒng)的設計與實現(xiàn)(基于百度智能云AI接口)

    ?博主介紹 :黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者,CSDN博客專家,在線教育專家,CSDN鉆石講師;專注大學生畢業(yè)設計教育和輔導。 所有項目都配有從入門到精通的基礎知識視頻課程,免費 項目配有對應開發(fā)文檔、開題報告、任務書、

    2024年02月04日
    瀏覽(95)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包