国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<li id="j7u7e"></li>

<ruby id="j7u7e"></ruby>

<style id="j7u7e"></style>

《AI上字幕》基于openAI研發(fā)的whisper模型，語音（視頻）一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》

2年前作者：ASH晗分類：Toy博客閱讀(24)違法舉報

這篇具有很好參考價值的文章主要介紹了《AI上字幕》基于openAI研發(fā)的whisper模型，語音（視頻）一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

簡介：

OpenAI的chatGPT非?；鸨鋵峅penAI旗下的另一個模型實力也十分強大，它就是開源免費的Whisper語音轉(zhuǎn)文本模型，目前為止它是較為頂尖的語音轉(zhuǎn)文本模型

當(dāng)前github上也有許多出色的開發(fā)者根據(jù)此模型開發(fā)出桌面版語音轉(zhuǎn)文字應(yīng)用。較為出色的分別是Buzz和WhisperDesktop

功能：

支持將多種語言的視頻或者音頻文件，轉(zhuǎn)換成字幕文件、帶時間軸的文本、純文本。

支持多語言音翻譯成英文

英文可以使用網(wǎng)頁翻譯功能翻譯成中文

用途：

字幕文件導(dǎo)入剪輯軟件可以一鍵上字幕，生產(chǎn)力MAX

配合PotPlayer能夠生成雙語字幕，學(xué)習(xí)英語簡直離不開它倆

對于純外語不帶字幕靠聽力的視頻資料，簡直不要太友好

視野開闊的必備工具，經(jīng)常了解世界頂尖科技的童鞋們應(yīng)該知道，大佬們的視頻基本都是口述講解，有了它，隨時隨地快速學(xué)習(xí)。

優(yōu)劣勢：

準(zhǔn)確率極高！超出你使用過的絕大多數(shù)在線轉(zhuǎn)寫！OpenAI訓(xùn)練的模型就不用多說了吧！基本不需要二次修改！

速度超快！Whisper使用GPU進(jìn)行轉(zhuǎn)寫（僅支持N卡），5分鐘的視頻還是使用最大的模型，親測只需要30秒！（沒有對比就沒有傷害，只有剪過視頻的同學(xué)才知道其他軟件的痛）

永久免費！一些在線轉(zhuǎn)字幕網(wǎng)站收費真的很貴，時間真的很長！

對于GPU性能弱的同學(xué)，Buzz使用CPU轉(zhuǎn)寫，雖然準(zhǔn)但是速度真的很慢，使用最大模型5分鐘的視頻能需要10分鐘。

僅支持本地使用，網(wǎng)頁視頻我從來不會用這個，網(wǎng)頁視頻可以使用插件生成雙語字幕，也很輕松，這里不做過多介紹。

下面貼出他們的官網(wǎng)：GitHub - chidiwilliams/buzz: Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.和GitHub - Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model??????

使用說明：

僅演示W(wǎng)hisper，Buzz和Whisper僅僅是界面不同，從官網(wǎng)下載后打開軟件程序，首先選擇模型，模型和程序都在上面的官網(wǎng)中。

點擊ok等待結(jié)束，然后第一欄選擇原音視頻的語音，translate若勾選則輸出英文，不勾選直接輸出原音視頻語言。

地址欄第一行選擇音視頻地址，第二行選擇輸出地址，若勾選place that file選項則代表輸出到原文件夾中。output format選項中選擇輸出類型：純文本，帶時間軸的文本，字幕srt文件等。

結(jié)束語：

汪~到這里教程完全結(jié)束了！本人不推薦buzz，由于它使用cpu處理文件，導(dǎo)致它處理速度和其他軟件速度不相上下。如果您的電腦為輕薄本，建議使用在線服務(wù)，例如訊飛每天有免費額度官網(wǎng)如下：訊飛聽見-免費在線錄音轉(zhuǎn)文字-語音轉(zhuǎn)文字-錄音整理-語音翻譯軟件

但是您仍然可以使用buzz因為它真的很準(zhǔn)確，遠(yuǎn)超其他軟件并且免費。

博主有話說：

算是給看到最后的人的福利吧建議看完

還記得三四年前大概是我大一的時候，剪視頻只能用一寫普通的模型轉(zhuǎn)換文字，準(zhǔn)確率很差，每次幾乎每句話都要重新修改，加字幕甚至需要一個小時以上，累得要死。

一兩年前，出現(xiàn)了類似訊飛這種語音行業(yè)頂尖的企業(yè)，準(zhǔn)確率大幅提升，我開始用手機語音轉(zhuǎn)文字，再把文字放入剪映中，加字幕不到半小時，但還是很麻煩。

現(xiàn)在，AI訓(xùn)練無數(shù)參數(shù)生成的模型，準(zhǔn)確率高的不用我再檢查，一鍵生成工具能夠調(diào)用模型，生成處理完成僅用幾分鐘。

人工智能真的是發(fā)展的飛快，世間也是滄海桑田，合理運用工具的人只會效率更高，我深有感觸，在最近的這些日子里，我學(xué)會了用chatgpt的API總結(jié)視頻網(wǎng)站，一瞬間爬取字幕，并總結(jié)視頻。這讓我學(xué)習(xí)教學(xué)視頻時知道哪些是我想要的，能夠快速獲取知識點。我學(xué)會了一鍵用chatgpt總結(jié)網(wǎng)頁，并列舉主要內(nèi)容，這使我在學(xué)習(xí)不同領(lǐng)域的知識時能夠快速獲取要點，還有好多。。

有些跑題了，就說到這里，但是這些能夠真真切切的提升我的學(xué)習(xí)效率。有那么一句話真的說的很對，AI不一定會淘汰你，淘汰你的是使用AI工具的人。至此，對大家進(jìn)行警醒，跟隨時代進(jìn)步，我們才會進(jìn)步。否則我們就會像上一代長輩不會使用手機一樣，被時代淘汰。

人生，是不斷的學(xué)習(xí)的過程，共勉。

以后在我博客中，不會再提及類似的感悟，算是給現(xiàn)在關(guān)注我的幾十個粉絲們的小福利吧！最后，文章內(nèi)容全部手打，本文用時6個小時。喜歡的朋友快來關(guān)注我吧！汪！（后續(xù)的文章可能會越來越精簡了）

附圖

附圖：調(diào)用chatgpt的api總結(jié)一篇教學(xué)文章，文章是隨機找的。

?附圖：對某個網(wǎng)頁視頻進(jìn)行總結(jié)。

?還沒想好后續(xù)寫什么，關(guān)注我，由淺入深學(xué)東西，歡迎私信！文章來源地址http://www.zghlxwxcb.cn/news/detail-417979.html

到了這里，關(guān)于《AI上字幕》基于openAI研發(fā)的whisper模型，語音（視頻）一鍵轉(zhuǎn)文本/字幕/帶時間軸/支持多語言/自帶翻譯《桌面版教程》的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

基于Whisper語音識別的實時視頻字幕生成 (一): 流式顯示視頻幀和音頻幀
Whistream（微流）是基于Whisper語音識別的的在線字幕生成工具，支持rtsp/rtmp/mp4等視頻流在線語音識別 whishow（微秀）是python實現(xiàn)的在線音視頻流播放器，支持rtsp/rtmp/mp4等流式輸入，也是whistream的前端。python實現(xiàn)原理如下： (1) SPROCESS.run() 的三個子線程負(fù)責(zé)：緩存流數(shù)據(jù)，處理音
2024年04月13日
瀏覽(96)
基于whisper模型的在線添加視頻字幕網(wǎng)站（持續(xù)更新）
Whisper 是一個自動語音識別（ASR，Automatic Speech Recognition）系統(tǒng)，OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時的多語言（98 種語言）和多任務(wù)（multitask）監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個龐大而多樣的數(shù)據(jù)集，可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除
2024年02月03日
瀏覽(57)
基于OpenAI的Whisper構(gòu)建的高效語音識別模型：faster-whisper
faster-whisper是基于OpenAI的Whisper模型的高效實現(xiàn)，它利用CTranslate2，一個專為Transformer模型設(shè)計的快速推理引擎。這種實現(xiàn)不僅提高了語音識別的速度，還優(yōu)化了內(nèi)存使用效率。faster-whisper的核心優(yōu)勢在于其能夠在保持原有模型準(zhǔn)確度的同時，大幅提升處理速度，這使得它在處理
2024年02月02日
瀏覽(95)
【開源工具】使用Whisper提取視頻、語音的字幕
運行 WhisperDesktop.exe , 啟動后加載模型“l(fā)oad model，please wait…”,等待其將模型加載到內(nèi)存。 2.1 下載模型剛開始是沒有模型的，需要到Hugging Face 2 的倉庫里面下載模型并配置相關(guān)路徑 2.1.1 進(jìn)入Hugging Face 2 的倉庫點擊 ggerganov/whisper.cpp 進(jìn)入Hugging Face倉庫 2.1.2 選擇需要下載的模型
2024年02月09日
瀏覽(84)
【開源工具】使用Whisper將提取視頻、語音的字幕
運行 WhisperDesktop.exe , 啟動后加載模型“l(fā)oad model，please wait…”,等待其將模型加載到內(nèi)存。 2.1 下載模型剛開始是沒有模型的，需要到Hugging Face 2 的倉庫里面下載模型并配置相關(guān)路徑 2.1.1 進(jìn)入Hugging Face 2 的倉庫點擊 ggerganov/whisper.cpp 進(jìn)入Hugging Face倉庫 2.1.2 選擇需要下載的模型
2024年02月08日
瀏覽(94)
whisper實踐--基于whisper+pyqt5開發(fā)的語音識別翻譯生成字幕工具
大家新年快樂，事業(yè)生活蒸蒸日上，解封的第一個年，想必大家都回家過年，好好陪陪家人了吧，這篇文章也是我在老家碼的，還記得上篇我?guī)Т蠹一玖私饬藈hisper，相信大家對whisper是什么，怎么安裝whisper，以及使用都有了一個認(rèn)識，這次作為新年第一篇文章，我將介紹一
2024年02月01日
瀏覽(27)
Whisper OpenAI開源語音識別模型
Whisper 是一個自動語音識別（ASR，Automatic Speech Recognition）系統(tǒng)，OpenAI 通過從網(wǎng)絡(luò)上收集了 68 萬小時的多語言（98 種語言）和多任務(wù)（multitask）監(jiān)督數(shù)據(jù)對 Whisper 進(jìn)行了訓(xùn)練。OpenAI 認(rèn)為使用這樣一個龐大而多樣的數(shù)據(jù)集，可以提高對口音、背景噪音和技術(shù)術(shù)語的識別能力。除
2024年02月16日
瀏覽(96)
OpenAI-whisper語音識別模型
Whisper是一個通用的語音識別模型。它是在不同音頻的大型數(shù)據(jù)集上訓(xùn)練的，也是一個多任務(wù)模型，可以執(zhí)行多語言語音識別、語音翻譯和語言識別。 whisper有五種模型尺寸，提供速度和準(zhǔn)確性的平衡，其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求
2024年02月09日
瀏覽(100)
使用OpenAI的Whisper 模型進(jìn)行語音識別
原文：https://baijiahao.baidu.com/s?id=1756232395896695428wfr=spiderfor=pc 語音識別是人工智能中的一個領(lǐng)域，它允許計算機理解人類語音并將其轉(zhuǎn)換為文本。該技術(shù)用于 Alexa 和各種聊天機器人應(yīng)用程序等設(shè)備。而我們最常見的就是語音轉(zhuǎn)錄，語音轉(zhuǎn)錄可以語音轉(zhuǎn)換為文字記錄或字幕。
2024年02月03日
瀏覽(88)
OpenAI Whisper 語音識別 API 模型使用 | python 語音識別
OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一個 Whisper 的語音識別模型。支持96種語言。 Python 安裝 openai 庫后，把需要翻譯的音頻目錄放進(jìn)去，運行程序即可生成音頻對應(yīng)的文字。以上。
2024年02月16日
瀏覽(93)