国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

語音識別開源框架 openAI-whisper

這篇具有很好參考價值的文章主要介紹了語音識別開源框架 openAI-whisper。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

Whisper 是一種通用的語音識別模型。 它是OpenAI于2022年9月份開源的在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的語音識別模型,也是一個可以執(zhí)行多語言語音識別、語音翻譯和語言識別的多任務(wù)模型。

GitHub - yeyupiaoling/Whisper-Finetune: 微調(diào)Whisper語音識別模型和加速推理,支持Web部署和Android部署

Whisper Webui - a Hugging Face Space by aadnk

微調(diào)Whisper語音識別模型和加速推理_夜雨飄零1的博客-CSDN博客

Openai-Whisper識別生成語音/視頻字幕文件(支持自動翻譯) - 嗶哩嗶哩

Whisper OpenAI開源語音識別模型_開源語音識別算法_Sanfor的博客-CSDN博客

conda create -n whisper python=3.9

conda activate whisper

pip install git+https://github.com/openai/whisper.git

whisper audio.mp3 --model medium --language Chinese

解決輸出繁體中文不輸出簡體中文問題:

whisper --language Chinese --model large audio.mp3 --initial_prompt "以下是 普通話句子"

就中文而言,Whisper各模型:

  • tiny 是沒有做斷句的,或者說,直接根據(jù)停頓斷句
  • base 已經(jīng)開始根據(jù)邏輯斷句,但會出語法錯誤
  • small 已經(jīng)很少語法錯誤,但斷句水平卻直線下降,很奇怪
  • medium 不僅能夠完美的斷句,還能判斷語氣

可以看出,飛書妙記給用戶開放的轉(zhuǎn)寫能力大約在 tiny 到 base 之間(轉(zhuǎn)寫速度也在 tiny 左右,已經(jīng)很快了)

值得指出的是,這里的對比,目的并不是比較二者的技術(shù),否則對于飛書妙計相當(dāng)?shù)牟还?,作為一款消費級應(yīng)用,它不可能給用戶跑medium等級的模型來做轉(zhuǎn)寫

對比的意義是,Whisper,作為一個開源模型,和消費級產(chǎn)品比起來怎么樣?

答案是,完全可以替代,用 small 模型足以實現(xiàn)當(dāng)下的免費體驗了。

甚至,用 medium 以上的模型,可以用「時間」換「好得多的使用體驗」

Whisper—通用的語音識別模型 - 知乎

https://www.bilibili.com/read/cv19254244

openai開源的whisper在huggingface中使用例子(語音轉(zhuǎn)文字中文)_語音識別_qq_37401291-開發(fā)者創(chuàng)業(yè)生態(tài)社區(qū)

OpenAI 開源音頻轉(zhuǎn)文字模型 Whisper 嘗鮮 - 少數(shù)派

Whisper—通用的語音識別模型 - 知乎

https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/demos/speech_web

OpenAI 開源語音識別模型 Whisper - OSCHINA - 中文開源技術(shù)交流社區(qū)

OpenAI Whisper中文語音識別效果嘗試和應(yīng)用(一)_迷途的小朋友的博客-CSDN博客文章來源地址http://www.zghlxwxcb.cn/news/detail-582329.html

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

OpenAI Whisper中文語音識別效果嘗試和應(yīng)用(一)_迷途的小朋友的博客-CSDN博客

到了這里,關(guān)于語音識別開源框架 openAI-whisper的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • OpenAI的人工智能語音識別模型Whisper詳解及使用

    OpenAI的人工智能語音識別模型Whisper詳解及使用

    ????????擁有ChatGPT語言模型的OpenAI公司,開源了 Whisper 自動語音識別系統(tǒng),OpenAI 強調(diào) Whisper 的語音識別能力已達(dá)到人類水準(zhǔn)。 ????????Whisper是一個通用的語音識別模型,它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練,能夠在英語語音識別上達(dá)到接近人類水平的魯

    2024年02月09日
    瀏覽(94)
  • .Net 使用OpenAI開源語音識別模型Whisper

    .Net 使用OpenAI開源語音識別模型Whisper

    .Net 使用OpenAI開源語音識別模型 Whisper Open AI在2022年9月21日開源了號稱其英文語音辨識能力已達(dá)到人類水準(zhǔn)的 Whisper 神經(jīng)網(wǎng)絡(luò),且它亦支持其它98種語言的自動語音辨識。 Whisper系統(tǒng)所提供的自動語音辨識(Automatic Speech Recognition,ASR)模型是被訓(xùn)練來運行語音辨識與翻譯任務(wù)的

    2024年02月08日
    瀏覽(86)
  • OpenAI開源??!Whisper語音識別實戰(zhàn)?。 经h(huán)境配置+代碼實現(xiàn)】

    OpenAI開源?。hisper語音識別實戰(zhàn)??!【環(huán)境配置+代碼實現(xiàn)】

    目錄 環(huán)境配置 代碼實現(xiàn) ******? 實現(xiàn) .mp4轉(zhuǎn)換為 .wav文件,識別后進(jìn)行匹配并輸出出現(xiàn)的次數(shù) ******? 完整代碼實現(xiàn)請私信 安裝 ffmpeg 打開網(wǎng)址? ?https://github.com/BtbN/FFmpeg-Builds/releases 下載如下圖所示的文件 下載后解壓 ?我的路徑是G:ffmpeg-master-latest-win64-gpl-shared

    2024年02月13日
    瀏覽(24)
  • 可以白嫖的語音識別開源項目whisper的搭建詳細(xì)過程 | 如何在Linux中搭建OpenAI開源的語音識別項目Whisper

    可以白嫖的語音識別開源項目whisper的搭建詳細(xì)過程 | 如何在Linux中搭建OpenAI開源的語音識別項目Whisper

    原文來自我個人的博客。 服務(wù)器為GPU服務(wù)器。點擊這里跳轉(zhuǎn)到我使用的GPU服務(wù)器。我搭建 whisper 選用的是 NVIDIA A 100顯卡,4GB顯存。 Python版本要在3.8~3.11之間。 輸入下面命令查看使用的Python版本。 為啥要安裝Anaconda? 為了減少不同項目使用的庫的版本沖突,我們可以使用An

    2024年02月09日
    瀏覽(19)
  • chatGPT的耳朵!OpenAI的開源語音識別AI:Whisper !

    chatGPT的耳朵!OpenAI的開源語音識別AI:Whisper !

    語音識別是通用人工智能的重要一環(huán)!可以說是AI的耳朵! 它可以讓機器理解人類的語音,并將其轉(zhuǎn)換為文本或其他形式的輸出。 語音識別的應(yīng)用場景非常廣泛,比如智能助理、語音搜索、語音翻譯、語音輸入等等。 然而,語音識別也面臨著很多挑戰(zhàn),比如不同的語言、口

    2024年03月14日
    瀏覽(26)
  • OpenAI開源全新解碼器和語音識別模型Whisper-v3

    OpenAI開源全新解碼器和語音識別模型Whisper-v3

    在11月7日OpenAI的首屆開發(fā)者大會上,除了推出一系列重磅產(chǎn)品之外,還開源了兩款產(chǎn)品,全新解碼器Consistency Decoder(一致性解碼器)和最新語音識別模型Whisper v3。 據(jù)悉,Consistency Decoder可以替代Stable Diffusion VAE解碼器。該解碼器可以改善所有與Stable Diffusion 1.0+ VAE兼容的圖像,

    2024年02月05日
    瀏覽(92)
  • OpenAI開源語音識別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

    OpenAI開源語音識別模型Whisper在Windows系統(tǒng)的安裝詳細(xì)過程

    Python的安裝很簡單,點擊這里進(jìn)行下載。 安裝完成之后,輸入python -V可以看到版本信息,說明已經(jīng)安裝成功了。 如果輸入python -V命令沒有看到上面的這樣的信息,要么是安裝失敗,要么是安裝好之后沒有自動配置環(huán)境變量,如何配置環(huán)境變量可以從網(wǎng)上搜索。 Python的具體安

    2024年02月08日
    瀏覽(89)
  • openai-whisper

    0. 參數(shù)說明 語音識別模型whisper的參數(shù)說明 1. 視頻語音轉(zhuǎn)文字 1. 提取b站視頻中的音頻,增加到自己的視頻里,并且顯示字幕 1. 下載b站視頻到電腦 1 如何將b站上的視頻下載到本地 2 download b zhan videos 2. 提取視頻中的音頻 3. 音頻轉(zhuǎn)文字 get 5 file 手把手教你從一無所有到財務(wù)自由

    2024年01月18日
    瀏覽(23)
  • 【語音識別】OpenAI whisper

    【語音識別】OpenAI whisper

    目錄 1. 簡單介紹 2.?代碼調(diào)用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的開源自動語音識別神經(jīng)網(wǎng)絡(luò) whisper 安裝 Python 調(diào)用

    2024年02月13日
    瀏覽(90)
  • OpenAI Whisper 語音識別 API 模型使用 | python 語音識別

    OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外,又推出了一個 Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后,把需要翻譯的音頻目錄放進(jìn)去,運行程序即可生成音頻對應(yīng)的文字。 以上。

    2024年02月16日
    瀏覽(93)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包