国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》

這篇具有很好參考價值的文章主要介紹了《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

簡介:

OpenAI的chatGPT非?;鸨鋵峅penAI旗下的另一個模型實力也十分強大,它就是開源免費的Whisper語音轉(zhuǎn)文本模型,目前為止它是較為頂尖的語音轉(zhuǎn)文本模型

當(dāng)前github上也有許多出色的開發(fā)者根據(jù)此模型開發(fā)出桌面版語音轉(zhuǎn)文字應(yīng)用。較為出色的分別是Buzz和WhisperDesktop

功能:

  • 支持將多種語言的視頻或者音頻文件,轉(zhuǎn)換成字幕文件、帶時間軸的文本、純文本。
  • 支持多語言音翻譯成英文
  • 英文可以使用網(wǎng)頁翻譯功能翻譯成中文

用途:

  • 字幕文件導(dǎo)入剪輯軟件可以一鍵上字幕,生產(chǎn)力MAX
  • 配合PotPlayer能夠生成雙語字幕,學(xué)習(xí)英語簡直離不開它倆
  • 對于純外語不帶字幕靠聽力的視頻資料,簡直不要太友好
  • 視野開闊的必備工具,經(jīng)常了解世界頂尖科技的童鞋們應(yīng)該知道,大佬們的視頻基本都是口述講解,有了它,隨時隨地快速學(xué)習(xí)。

優(yōu)劣勢:

  • 準(zhǔn)確率極高!超出你使用過的絕大多數(shù)在線轉(zhuǎn)寫!OpenAI訓(xùn)練的模型就不用多說了吧!基本不需要二次修改!
  • 速度超快!Whisper使用GPU進(jìn)行轉(zhuǎn)寫(僅支持N卡),5分鐘的視頻還是使用最大的模型,親測只需要30秒!(沒有對比就沒有傷害,只有剪過視頻的同學(xué)才知道其他軟件的痛)
  • 永久免費!一些在線轉(zhuǎn)字幕網(wǎng)站收費真的很貴,時間真的很長!
  • 對于GPU性能弱的同學(xué),Buzz使用CPU轉(zhuǎn)寫,雖然準(zhǔn)但是速度真的很慢,使用最大模型5分鐘的視頻能需要10分鐘。
  • 僅支持本地使用,網(wǎng)頁視頻我從來不會用這個,網(wǎng)頁視頻可以使用插件生成雙語字幕,也很輕松,這里不做過多介紹。

下面貼出他們的官網(wǎng):GitHub - chidiwilliams/buzz: Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.和GitHub - Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model??????

使用說明:

僅演示W(wǎng)hisper,Buzz和Whisper僅僅是界面不同,從官網(wǎng)下載后打開軟件程序,首先選擇模型,模型和程序都在上面的官網(wǎng)中。

《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》

點擊ok等待結(jié)束,然后第一欄選擇原音視頻的語音,translate若勾選則輸出英文,不勾選直接輸出原音視頻語言。

《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》

地址欄第一行選擇音視頻地址,第二行選擇輸出地址,若勾選place that file選項則代表輸出到原文件夾中。output format選項中選擇輸出類型:純文本,帶時間軸的文本,字幕srt文件等。

結(jié)束語:

汪~到這里教程完全結(jié)束了!本人不推薦buzz,由于它使用cpu處理文件,導(dǎo)致它處理速度和其他軟件速度不相上下。如果您的電腦為輕薄本,建議使用在線服務(wù),例如訊飛每天有免費額度官網(wǎng)如下:訊飛聽見-免費在線錄音轉(zhuǎn)文字-語音轉(zhuǎn)文字-錄音整理-語音翻譯軟件

但是您仍然可以使用buzz因為它真的很準(zhǔn)確,遠(yuǎn)超其他軟件并且免費。

博主有話說:

算是給看到最后的人的福利吧建議看完


還記得三四年前大概是我大一的時候,剪視頻只能用一寫普通的模型轉(zhuǎn)換文字,準(zhǔn)確率很差,每次幾乎每句話都要重新修改,加字幕甚至需要一個小時以上,累得要死。

一兩年前,出現(xiàn)了類似訊飛這種語音行業(yè)頂尖的企業(yè),準(zhǔn)確率大幅提升,我開始用手機語音轉(zhuǎn)文字,再把文字放入剪映中,加字幕不到半小時,但還是很麻煩。

現(xiàn)在,AI訓(xùn)練無數(shù)參數(shù)生成的模型,準(zhǔn)確率高的不用我再檢查,一鍵生成工具能夠調(diào)用模型,生成處理完成僅用幾分鐘。


人工智能真的是發(fā)展的飛快,世間也是滄海桑田,合理運用工具的人只會效率更高,我深有感觸,在最近的這些日子里,我學(xué)會了用chatgpt的API總結(jié)視頻網(wǎng)站,一瞬間爬取字幕,并總結(jié)視頻。這讓我學(xué)習(xí)教學(xué)視頻時知道哪些是我想要的,能夠快速獲取知識點。我學(xué)會了一鍵用chatgpt總結(jié)網(wǎng)頁,并列舉主要內(nèi)容,這使我在學(xué)習(xí)不同領(lǐng)域的知識時能夠快速獲取要點,還有好多。。


有些跑題了,就說到這里,但是這些能夠真真切切的提升我的學(xué)習(xí)效率。有那么一句話真的說的很對,AI不一定會淘汰你,淘汰你的是使用AI工具的人。至此,對大家進(jìn)行警醒,跟隨時代進(jìn)步,我們才會進(jìn)步。否則我們就會像上一代長輩不會使用手機一樣,被時代淘汰。


人生,是不斷的學(xué)習(xí)的過程,共勉。


以后在我博客中,不會再提及類似的感悟,算是給現(xiàn)在關(guān)注我的幾十個粉絲們的小福利吧!最后,文章內(nèi)容全部手打,本文用時6個小時。喜歡的朋友快來關(guān)注我吧!汪!(后續(xù)的文章可能會越來越精簡了)

附圖

附圖:調(diào)用chatgpt的api總結(jié)一篇教學(xué)文章,文章是隨機找的。

《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》

?附圖:對某個網(wǎng)頁視頻進(jìn)行總結(jié)。

《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》

?還沒想好后續(xù)寫什么,關(guān)注我,由淺入深學(xué)東西,歡迎私信!文章來源地址http://www.zghlxwxcb.cn/news/detail-417979.html

到了這里,關(guān)于《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 基于Whisper語音識別的實時視頻字幕生成 (一): 流式顯示視頻幀和音頻幀

    基于Whisper語音識別的實時視頻字幕生成 (一): 流式顯示視頻幀和音頻幀

    Whistream(微流)是基于Whisper語音識別的的在線字幕生成工具,支持rtsp/rtmp/mp4等視頻流在線語音識別 whishow(微秀)是python實現(xiàn)的在線音視頻流播放器,支持rtsp/rtmp/mp4等流式輸入,也是whistream的前端。python實現(xiàn)原理如下: (1) SPROCESS.run() 的三個子線程負(fù)責(zé):緩存流數(shù)據(jù),處理音

    2024年04月13日
    瀏覽(96)
  • 基于whisper模型的在線添加視頻字幕網(wǎng)站(持續(xù)更新)

    基于whisper模型的在線添加視頻字幕網(wǎng)站(持續(xù)更新)

    Whisper 是一個自動語音識別(ASR,Automatic Speech Recognition)系統(tǒng),OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時的多語言(98 種語言)和多任務(wù)(multitask)監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個龐大而多樣的數(shù)據(jù)集,可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除

    2024年02月03日
    瀏覽(57)
  • 基于OpenAI的Whisper構(gòu)建的高效語音識別模型:faster-whisper

    基于OpenAI的Whisper構(gòu)建的高效語音識別模型:faster-whisper

    faster-whisper是基于OpenAI的Whisper模型的高效實現(xiàn),它利用CTranslate2,一個專為Transformer模型設(shè)計的快速推理引擎。這種實現(xiàn)不僅提高了語音識別的速度,還優(yōu)化了內(nèi)存使用效率。faster-whisper的核心優(yōu)勢在于其能夠在保持原有模型準(zhǔn)確度的同時,大幅提升處理速度,這使得它在處理

    2024年02月02日
    瀏覽(95)
  • 【開源工具】使用Whisper提取視頻、語音的字幕

    【開源工具】使用Whisper提取視頻、語音的字幕

    運行 WhisperDesktop.exe , 啟動后加載模型“l(fā)oad model,please wait…”,等待其將模型加載到內(nèi)存。 2.1 下載模型 剛開始是沒有模型的,需要到Hugging Face 2 的倉庫里面下載模型并配置相關(guān)路徑 2.1.1 進(jìn)入Hugging Face 2 的倉庫 點擊 ggerganov/whisper.cpp 進(jìn)入Hugging Face倉庫 2.1.2 選擇需要下載的模型

    2024年02月09日
    瀏覽(84)
  • 【開源工具】使用Whisper將提取視頻、語音的字幕

    【開源工具】使用Whisper將提取視頻、語音的字幕

    運行 WhisperDesktop.exe , 啟動后加載模型“l(fā)oad model,please wait…”,等待其將模型加載到內(nèi)存。 2.1 下載模型 剛開始是沒有模型的,需要到Hugging Face 2 的倉庫里面下載模型并配置相關(guān)路徑 2.1.1 進(jìn)入Hugging Face 2 的倉庫 點擊 ggerganov/whisper.cpp 進(jìn)入Hugging Face倉庫 2.1.2 選擇需要下載的模型

    2024年02月08日
    瀏覽(94)
  • whisper實踐--基于whisper+pyqt5開發(fā)的語音識別翻譯生成字幕工具

    whisper實踐--基于whisper+pyqt5開發(fā)的語音識別翻譯生成字幕工具

    大家新年快樂,事業(yè)生活蒸蒸日上,解封的第一個年,想必大家都回家過年,好好陪陪家人了吧,這篇文章也是我在老家碼的,還記得上篇我?guī)Т蠹一玖私饬藈hisper,相信大家對whisper是什么,怎么安裝whisper,以及使用都有了一個認(rèn)識,這次作為新年第一篇文章,我將介紹一

    2024年02月01日
    瀏覽(27)
  • Whisper OpenAI開源語音識別模型

    Whisper 是一個自動語音識別(ASR,Automatic Speech Recognition)系統(tǒng),OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時的多語言(98 種語言)和多任務(wù)(multitask)監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個龐大而多樣的數(shù)據(jù)集,可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除

    2024年02月16日
    瀏覽(96)
  • OpenAI-whisper語音識別模型

    OpenAI-whisper語音識別模型

    Whisper是一個通用的語音識別模型。它是在不同音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個多任務(wù)模型,可以執(zhí)行多語言語音識別、語音翻譯和語言識別。 whisper有五種模型尺寸,提供速度和準(zhǔn)確性的平衡,其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求

    2024年02月09日
    瀏覽(100)
  • 使用OpenAI的Whisper 模型進(jìn)行語音識別

    使用OpenAI的Whisper 模型進(jìn)行語音識別

    原文:https://baijiahao.baidu.com/s?id=1756232395896695428wfr=spiderfor=pc 語音識別是人工智能中的一個領(lǐng)域,它允許計算機理解人類語音并將其轉(zhuǎn)換為文本。 該技術(shù)用于 Alexa 和各種聊天機器人應(yīng)用程序等設(shè)備。 而我們最常見的就是語音轉(zhuǎn)錄,語音轉(zhuǎn)錄可以語音轉(zhuǎn)換為文字記錄或字幕。

    2024年02月03日
    瀏覽(88)
  • OpenAI Whisper 語音識別 API 模型使用 | python 語音識別

    OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外,又推出了一個 Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后,把需要翻譯的音頻目錄放進(jìn)去,運行程序即可生成音頻對應(yīng)的文字。 以上。

    2024年02月16日
    瀏覽(93)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包