簡介:
OpenAI的chatGPT非?;鸨鋵峅penAI旗下的另一個模型實力也十分強大,它就是開源免費的Whisper語音轉(zhuǎn)文本模型,目前為止它是較為頂尖的語音轉(zhuǎn)文本模型
當(dāng)前github上也有許多出色的開發(fā)者根據(jù)此模型開發(fā)出桌面版語音轉(zhuǎn)文字應(yīng)用。較為出色的分別是Buzz和WhisperDesktop
功能:
- 支持將多種語言的視頻或者音頻文件,轉(zhuǎn)換成字幕文件、帶時間軸的文本、純文本。
- 支持多語言音翻譯成英文
- 英文可以使用網(wǎng)頁翻譯功能翻譯成中文
用途:
- 字幕文件導(dǎo)入剪輯軟件可以一鍵上字幕,生產(chǎn)力MAX
- 配合PotPlayer能夠生成雙語字幕,學(xué)習(xí)英語簡直離不開它倆
- 對于純外語不帶字幕靠聽力的視頻資料,簡直不要太友好
- 視野開闊的必備工具,經(jīng)常了解世界頂尖科技的童鞋們應(yīng)該知道,大佬們的視頻基本都是口述講解,有了它,隨時隨地快速學(xué)習(xí)。
優(yōu)劣勢:
- 準(zhǔn)確率極高!超出你使用過的絕大多數(shù)在線轉(zhuǎn)寫!OpenAI訓(xùn)練的模型就不用多說了吧!基本不需要二次修改!
- 速度超快!Whisper使用GPU進(jìn)行轉(zhuǎn)寫(僅支持N卡),5分鐘的視頻還是使用最大的模型,親測只需要30秒!(沒有對比就沒有傷害,只有剪過視頻的同學(xué)才知道其他軟件的痛)
- 永久免費!一些在線轉(zhuǎn)字幕網(wǎng)站收費真的很貴,時間真的很長!
- 對于GPU性能弱的同學(xué),Buzz使用CPU轉(zhuǎn)寫,雖然準(zhǔn)但是速度真的很慢,使用最大模型5分鐘的視頻能需要10分鐘。
- 僅支持本地使用,網(wǎng)頁視頻我從來不會用這個,網(wǎng)頁視頻可以使用插件生成雙語字幕,也很輕松,這里不做過多介紹。
下面貼出他們的官網(wǎng):GitHub - chidiwilliams/buzz: Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.和GitHub - Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model??????
使用說明:
僅演示W(wǎng)hisper,Buzz和Whisper僅僅是界面不同,從官網(wǎng)下載后打開軟件程序,首先選擇模型,模型和程序都在上面的官網(wǎng)中。
點擊ok等待結(jié)束,然后第一欄選擇原音視頻的語音,translate若勾選則輸出英文,不勾選直接輸出原音視頻語言。
地址欄第一行選擇音視頻地址,第二行選擇輸出地址,若勾選place that file選項則代表輸出到原文件夾中。output format選項中選擇輸出類型:純文本,帶時間軸的文本,字幕srt文件等。
結(jié)束語:
汪~到這里教程完全結(jié)束了!本人不推薦buzz,由于它使用cpu處理文件,導(dǎo)致它處理速度和其他軟件速度不相上下。如果您的電腦為輕薄本,建議使用在線服務(wù),例如訊飛每天有免費額度官網(wǎng)如下:訊飛聽見-免費在線錄音轉(zhuǎn)文字-語音轉(zhuǎn)文字-錄音整理-語音翻譯軟件
但是您仍然可以使用buzz因為它真的很準(zhǔn)確,遠(yuǎn)超其他軟件并且免費。
博主有話說:
算是給看到最后的人的福利吧建議看完
還記得三四年前大概是我大一的時候,剪視頻只能用一寫普通的模型轉(zhuǎn)換文字,準(zhǔn)確率很差,每次幾乎每句話都要重新修改,加字幕甚至需要一個小時以上,累得要死。
一兩年前,出現(xiàn)了類似訊飛這種語音行業(yè)頂尖的企業(yè),準(zhǔn)確率大幅提升,我開始用手機語音轉(zhuǎn)文字,再把文字放入剪映中,加字幕不到半小時,但還是很麻煩。
現(xiàn)在,AI訓(xùn)練無數(shù)參數(shù)生成的模型,準(zhǔn)確率高的不用我再檢查,一鍵生成工具能夠調(diào)用模型,生成處理完成僅用幾分鐘。
人工智能真的是發(fā)展的飛快,世間也是滄海桑田,合理運用工具的人只會效率更高,我深有感觸,在最近的這些日子里,我學(xué)會了用chatgpt的API總結(jié)視頻網(wǎng)站,一瞬間爬取字幕,并總結(jié)視頻。這讓我學(xué)習(xí)教學(xué)視頻時知道哪些是我想要的,能夠快速獲取知識點。我學(xué)會了一鍵用chatgpt總結(jié)網(wǎng)頁,并列舉主要內(nèi)容,這使我在學(xué)習(xí)不同領(lǐng)域的知識時能夠快速獲取要點,還有好多。。
有些跑題了,就說到這里,但是這些能夠真真切切的提升我的學(xué)習(xí)效率。有那么一句話真的說的很對,AI不一定會淘汰你,淘汰你的是使用AI工具的人。至此,對大家進(jìn)行警醒,跟隨時代進(jìn)步,我們才會進(jìn)步。否則我們就會像上一代長輩不會使用手機一樣,被時代淘汰。
人生,是不斷的學(xué)習(xí)的過程,共勉。
以后在我博客中,不會再提及類似的感悟,算是給現(xiàn)在關(guān)注我的幾十個粉絲們的小福利吧!最后,文章內(nèi)容全部手打,本文用時6個小時。喜歡的朋友快來關(guān)注我吧!汪!(后續(xù)的文章可能會越來越精簡了)
附圖
附圖:調(diào)用chatgpt的api總結(jié)一篇教學(xué)文章,文章是隨機找的。
?附圖:對某個網(wǎng)頁視頻進(jìn)行總結(jié)。
文章來源:http://www.zghlxwxcb.cn/news/detail-417979.html
?還沒想好后續(xù)寫什么,關(guān)注我,由淺入深學(xué)東西,歡迎私信!文章來源地址http://www.zghlxwxcb.cn/news/detail-417979.html
到了這里,關(guān)于《AI上字幕》基于openAI研發(fā)的whisper模型,語音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!