国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

AI語音識別模塊--whisper模塊

2年前作者：杰尼龜消防員分類：Toy博客閱讀(18)違法舉報

這篇具有很好參考價值的文章主要介紹了AI語音識別模塊--whisper模塊。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

1.下載 ffmpeg，挑一個自己電腦系統(tǒng)的版本，下載，如我win64：

地址：

Releases · BtbN/FFmpeg-Builds · GitHub

下載壓縮包zip，到·本地

解壓安裝，其實無需安裝，只需把對應的目錄下的bin，

編輯環(huán)境變量的path，添加到環(huán)境變量即可！?。?/p>

不能科學的同學，可以到網(wǎng)盤地址，下載壓縮包zip

鏈接：https://pan.baidu.com/s/1yBQBs-pUKOpUPeIJpPsURA?pwd=6543?
提取碼：6543?

2.下載whisper：

查看模型的地址：? ? ? ? ? ? ? https://github.com/openai/whisper/blob/main/whisper/__init__.py? ? ??

查看初始化文件： __init__，內含各個模型的地址，就省得取hugging-face里下載了...

AI語音識別模塊--whisper模塊,人工智能,語音識別

例如,依次從小到大...配置要求如下：

AI語音識別模塊--whisper模塊,人工智能,語音識別

地址：：：

?"tiny"最小化模型: "https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt",

"base"基礎款模型: "https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b1c0edf879ad9b11b1af5a0e6ab5db9205f891f668f8b0e6c6326e34e/base.pt",

?"small"小型化模型: "https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt",

3.根據(jù) tree/main分支下，進行環(huán)境的配置：：

地址：

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

下滑到底下，即可看到

AI語音識別模塊--whisper模塊,人工智能,語音識別

安裝好后，直接是cpu版本的pytorch，如若需要gpu版本，可自行安裝....

pip uninstall torch，再 pip install 自己gpu版本的torch即可?。?！...

4.運用命令：

whisper test.mp3 --model small --model_dir?D:\qbroDownload\whisper-model --language Chinese

#?whisper 音頻文件?

--model 模型規(guī)格?

--model_dir?模型路徑

--language 語言選擇/可不選....提前選好可加速..

產(chǎn)生報錯：：：

transcribe.py:115: UserWarning: FP16 is not supported on CPU; using FP32 instead

5.詳情代碼：：

可作為參考....文章來源地址http://www.zghlxwxcb.cn/news/detail-830901.html

import whisper
# 有下載到本地，直接加載 base.pt也可以，不然會直接網(wǎng)絡下載
model = whisper.load_model('base')

# 1.傳入音頻、fp16-cpu版本，gpu版本可以忽略，語言可選項...默認繁體字，用base模型，輸出簡體字...
result = model.transcribe('./op.wav',fp16=False,language='Chinese')
print(result['text'])

# 2.傳入視頻也可以...
result1 = model.result = model.transcribe('./video.mp4',fp16=False,language='Chinese')
print(result1['text'])

到了這里，關于AI語音識別模塊--whisper模塊的文章就介紹完了。如果您還想了解更多內容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉載，請注明出處：如若內容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

人工智能技術在智能音箱中的應用：智能語音識別與智能交互
作者：禪與計算機程序設計藝術引言 1.1. 背景介紹智能音箱作為智能家居的重要組成部分，近年來得到了越來越多的用戶青睞。隨著人工智能技術的不斷發(fā)展，智能音箱的核心功能之一——智能語音識別與智能交互也越來越受到人們的關注。智能語音識別技術可以讓用戶更
2024年02月07日
瀏覽(31)
第14章-Python-人工智能-語言識別-調用百度語音識別
? ? ? ? 百度語音識別API是可以免費試用的，通過百度賬號登錄到百度智能云，在語音技術頁面創(chuàng)建的應用，生成一個語音識別的應用，這個應用會給你一個APIKey和一個Secret Key，如圖14.1所示。 ?我們在自己的程序中用 API Key 和 Secret Key 這兩個值獲取 Koken，然后再通過 Token 調
2024年02月08日
瀏覽(103)
語音識別與VC維：改變人工智能的未來
語音識別(Speech Recognition)是一種人工智能技術，它旨在將人類的語音信號轉換為文本或其他形式的數(shù)據(jù)。這項技術在過去幾年中得到了巨大的發(fā)展，并成為人工智能領域的一個關鍵技術。VC維(Vocabulary Coverage Dimension)是一種數(shù)學模型，用于描述語言模型的表達能力。在本文中，
2024年02月19日
瀏覽(25)
【人工智能】科大訊飛語音識別應用開發(fā)（第三集）
這次需要對科大訊飛語音識別接口進行語音識別應用開發(fā)，前兩次都是通過WebAPI調用接口，這次換一下，通過SDK調用接口下面是開發(fā)的詳細記錄過程（基于前兩次的基礎上）網(wǎng)址：https://www.xfyun.cn/services/voicedictation 不領服務量為500且該包免費（貌似是不同應用都可以免費領
2024年02月13日
瀏覽(22)
人工智能-語音識別技術paddlespeech的搭建和使用
PaddleSpeech是百度飛槳（PaddlePaddle）開源深度學習平臺的其中一個項目，它基于飛槳的語音方向模型庫，用于語音和音頻中的各種關鍵任務的開發(fā)，包含大量基于深度學習前沿和有影響力的模型。PaddleSpeech支持語音識別、語音翻譯（英譯中）、語音合成、標點恢復等應用示例。
2024年02月02日
瀏覽(29)
構建基于AWSLambda的人工智能應用：語音識別、圖像識別和自然語言處理
作者：禪與計算機程序設計藝術在人工智能領域，用大數(shù)據(jù)、機器學習等方法來解決復雜的問題，已經(jīng)成為越來越多企業(yè)和開發(fā)者關注的問題。但是，如何把這些方法落地到生產(chǎn)環(huán)境中，仍然是一個難題。隨著云計算平臺的廣泛普及，AWS Lambda作為一項服務正在成為各個公司
2024年02月09日
瀏覽(36)
AI人工智能課題：圖像識別貨幣識別系統(tǒng)的設計與實現(xiàn)（基于百度智能云AI接口）
?博主介紹：黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者，CSDN博客專家，在線教育專家，CSDN鉆石講師；專注大學生畢業(yè)設計教育和輔導。所有項目都配有從入門到精通的基礎知識視頻課程，免費項目配有對應開發(fā)文檔、開題報告、任務書、
2024年02月04日
瀏覽(97)
AI人工智能課題：圖像識別菜品識別系統(tǒng)的設計與實現(xiàn)（基于百度智能云AI接口）
?博主介紹：黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者，CSDN博客專家，在線教育專家，CSDN鉆石講師；專注大學生畢業(yè)設計教育和輔導。所有項目都配有從入門到精通的基礎知識視頻課程，免費項目配有對應開發(fā)文檔、開題報告、任務書、
2024年02月03日
瀏覽(28)
AI人工智能課題：圖像識別紅酒識別系統(tǒng)的設計與實現(xiàn)（基于百度智能云AI接口）
?博主介紹：黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者，CSDN博客專家，在線教育專家，CSDN鉆石講師；專注大學生畢業(yè)設計教育和輔導。所有項目都配有從入門到精通的基礎知識視頻課程，免費項目配有對應開發(fā)文檔、開題報告、任務書、
2024年02月04日
瀏覽(33)
AI人工智能課題：圖像識別地標識別系統(tǒng)的設計與實現(xiàn)（基于百度智能云AI接口）
?博主介紹：黃菊華老師《Vue.js入門與商城開發(fā)實戰(zhàn)》《微信小程序商城開發(fā)》圖書作者，CSDN博客專家，在線教育專家，CSDN鉆石講師；專注大學生畢業(yè)設計教育和輔導。所有項目都配有從入門到精通的基礎知識視頻課程，免費項目配有對應開發(fā)文檔、開題報告、任務書、
2024年02月04日
瀏覽(95)

<th id="zcei4"><pre id="zcei4"><legend id="zcei4"></legend></pre></th>