国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具

這篇具有很好參考價(jià)值的文章主要介紹了whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

大家新年快樂(lè),事業(yè)生活蒸蒸日上,解封的第一個(gè)年,想必大家都回家過(guò)年,好好陪陪家人了吧,這篇文章也是我在老家碼的,還記得上篇我?guī)Т蠹一玖私饬藈hisper,相信大家對(duì)whisper是什么,怎么安裝whisper,以及使用都有了一個(gè)認(rèn)識(shí),這次作為新年第一篇文章,我將介紹一下自己開(kāi)發(fā)的基于whisper+pyqt5做的一個(gè)字幕生成工具,還挺有意思的,中間也遇到各種問(wèn)題,然后解決。每次嘗試做什么,最爽莫過(guò)于遇到問(wèn)題,然后一一解決,最后成功的實(shí)現(xiàn)自己想要的,就算是一個(gè)再簡(jiǎn)單的項(xiàng)目,相信大家只要有成長(zhǎng)就會(huì)很滿足開(kāi)心吧。話不多說(shuō),直接進(jìn)入今天的主題,讓我們來(lái)看看這個(gè)工具。

  • 外觀

首先讓我們來(lái)看看工具樣子如下圖所示,自我吐槽一下,界面挺丑的,不得不感嘆自己沒(méi)有界面審美,不過(guò)我已經(jīng)盡力了,哈哈,不過(guò)自我感覺(jué)看這個(gè)界面還是挺直觀的就能知道這個(gè)工具的作用,以及使用也很直接方便。主要有兩個(gè)模塊,如圖,1為選擇模塊,2為運(yùn)行結(jié)果顯示模塊。

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具?

?文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-428124.html

  • 功能介紹
  • 公共選擇部分

?

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具

?

如上圖紅色框所示,所有功能這幾個(gè)選擇框是公用的,文字應(yīng)該寫的也算清楚,簡(jiǎn)單介紹一下。

模型選擇:必選項(xiàng),選擇一個(gè)whisper模型。

語(yǔ)言選擇:必選項(xiàng),選擇一個(gè)要識(shí)別翻譯成哪種語(yǔ)言。

計(jì)算引擎選擇:非必選項(xiàng),不選默認(rèn)為cpu。

模型讀取保存路徑:非必選項(xiàng),不選默認(rèn)在應(yīng)用目錄下,如果事先下好模型,可以選擇對(duì)應(yīng)目錄,避免應(yīng)用第一次下載找不到模型從而下載模型。

輸出文件保存路徑:必選項(xiàng),選擇運(yùn)行生成文件的保存路徑。

結(jié)束按鈕:需要停止正在執(zhí)行的功能,可以點(diǎn)擊此按鈕。

?

  • 功能部分

1.生成字幕文件:音頻文件或者視頻文件根據(jù)選擇的語(yǔ)言生成一個(gè)對(duì)應(yīng)語(yǔ)言的srt字幕文件,文件內(nèi)容為音頻文件或者視頻文件說(shuō)的內(nèi)容,效果如圖所示

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具

?

2.視頻添加字幕:視頻文件根據(jù)選擇的語(yǔ)言自動(dòng)為視頻添加srt字幕,效果如圖所示

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具

?

3.監(jiān)聽(tīng)聲音翻譯:監(jiān)聽(tīng)window的喇叭發(fā)出的聲音并且識(shí)別生成srt字幕文件,不過(guò)這個(gè)功能因?yàn)闆](méi)時(shí)間弄,暫時(shí)沒(méi)弄,后面有時(shí)間會(huì)加上,界面暫時(shí)如下圖所示

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具?

?

  • 問(wèn)題以及總結(jié)

軟件已經(jīng)介紹完了,在開(kāi)發(fā)過(guò)程中其實(shí)遇到了很多坑,比如第一次使用pyqt5,跟主要功能模塊的信息傳遞,以及使用pyinstaller打包成應(yīng)用的時(shí)候會(huì)遇到很多坑,這里著重記錄下。

使用pyinstaller -D 主程序文件打包的時(shí)候,運(yùn)行會(huì)有一堆問(wèn)題,然后仔細(xì)看打包過(guò)程會(huì)有很多警告,有些包沒(méi)打進(jìn)去,需要在打包的時(shí)候把這些包使用--copy-metadata添加指定包的元數(shù)據(jù)進(jìn)來(lái),最后打包成功后,發(fā)現(xiàn)python的whisper模塊不在應(yīng)用里,可以將python目錄下的whisper復(fù)制到應(yīng)用目錄里,然后由于使用到了ffmpeg所以也需要把這個(gè)文件復(fù)制到應(yīng)用目錄中,才成功運(yùn)行,本以為萬(wàn)事大吉,但是這個(gè)應(yīng)用會(huì)自帶cmd窗口,于是在打包命令中添加-w參數(shù),但是又遇到到了挺多問(wèn)題這里主要記錄兩個(gè):

1.AttributeError: 'NoneType' object has no attribute 'flush'這個(gè)錯(cuò)誤,根據(jù)提示找到對(duì)應(yīng)python模塊sitr-packages/transformers/utils/logging.py的如下代碼段,修改如下圖所示

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具?

?

2.最后運(yùn)行應(yīng)用的時(shí)候下載模型會(huì)一直卡住,這是由于關(guān)閉了窗口,有些代碼使用了需要從cmd中獲取打印消息或者顯示到cmd的功能,所以這里排查到應(yīng)該是whisper下載模型的時(shí)候使用了tqdm來(lái)顯示進(jìn)度條導(dǎo)致的,所以到whisper的__init__.py文件中找到這段代碼將如下圖所示兩行代碼注釋掉即可。

whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具?

?

最后再附上打包命令:

pyinstaller --upx-dir=C:\Users\xxx\Desktop\upx\upx-4.0.1-win64 -D -w pythoner_league_translate.py --copy-metadata tqdm --copy-metadata regex --copy-metadata tokenizers --copy-metadata numpy --copy-metadata regex --copy-metadata packaging --copy-metadata filelock --copy-metadata requests --copy-metadata whisper

其中upx地址,可以自己下載一個(gè)upx然后替換成你自己電腦路徑即可

忘記說(shuō)了whisper默認(rèn)的中文是繁體字,這里本人已經(jīng)把它轉(zhuǎn)換成簡(jiǎn)體了。

如果大家有興趣想玩玩,應(yīng)用我已經(jīng)幫大家打包好了,可以直接使用,代碼也有,下面是各個(gè)下載地址:

應(yīng)用模型下載地址(現(xiàn)在只打包了exe應(yīng)用,如后續(xù)有需要可以打包mac應(yīng)用):

鏈接:https://pan.baidu.com/s/1nj174s3tyHUAsazi4tHW0g

提取碼:3ugi

代碼gihub地址:https://github.com/PythonerLeague/PythonerLeague_translate

最后有問(wèn)題可以留言或者關(guān)注PythonerLeague公眾號(hào)進(jìn)行溝通,這次分享就到這里了,最后再祝大家新年開(kāi)開(kāi)心心,有時(shí)間記得多陪陪家人。

?

?

?

?

?

?

?

到了這里,關(guān)于whisper實(shí)踐--基于whisper+pyqt5開(kāi)發(fā)的語(yǔ)音識(shí)別翻譯生成字幕工具的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 基于opencv和PyQt5的人臉識(shí)別

    基于opencv和PyQt5的人臉識(shí)別

    目? ? 錄 一、準(zhǔn)備工作 二、分割任務(wù) 三、代碼實(shí)現(xiàn)階段 1、基于opencv讀取照片 2、在圖片上繪制矩形 3、在讀取照片成功的前提下理解視頻的本質(zhì),讀取視頻 4、在視頻上繪制矩形 5、調(diào)用人臉識(shí)別模塊 ?6、動(dòng)態(tài)調(diào)整矩形,讓矩形通過(guò)人臉識(shí)別算法追蹤人臉 7、調(diào)用Qt組件,創(chuàng)

    2024年02月03日
    瀏覽(17)
  • [python]基于faster whisper實(shí)時(shí)語(yǔ)音識(shí)別語(yǔ)音轉(zhuǎn)文本

    語(yǔ)音識(shí)別轉(zhuǎn)文本相信很多人都用過(guò),不管是手機(jī)自帶,還是騰訊視頻都附帶有此功能,今天簡(jiǎn)單說(shuō)下: faster whisper地址: https://github.com/SYSTRAN/faster-whisper https://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper 實(shí)現(xiàn)功能: 從麥克風(fēng)獲取聲音進(jìn)行實(shí)時(shí)語(yǔ)音識(shí)別轉(zhuǎn)文本 代碼僅僅

    2024年02月03日
    瀏覽(33)
  • 基于OpenAI的Whisper構(gòu)建的高效語(yǔ)音識(shí)別模型:faster-whisper

    基于OpenAI的Whisper構(gòu)建的高效語(yǔ)音識(shí)別模型:faster-whisper

    faster-whisper是基于OpenAI的Whisper模型的高效實(shí)現(xiàn),它利用CTranslate2,一個(gè)專為Transformer模型設(shè)計(jì)的快速推理引擎。這種實(shí)現(xiàn)不僅提高了語(yǔ)音識(shí)別的速度,還優(yōu)化了內(nèi)存使用效率。faster-whisper的核心優(yōu)勢(shì)在于其能夠在保持原有模型準(zhǔn)確度的同時(shí),大幅提升處理速度,這使得它在處理

    2024年02月02日
    瀏覽(94)
  • 開(kāi)源C++智能語(yǔ)音識(shí)別庫(kù)whisper.cpp開(kāi)發(fā)使用入門

    whisper.cpp是一個(gè)C++編寫的輕量級(jí)開(kāi)源智能語(yǔ)音識(shí)別庫(kù),是基于openai的開(kāi)源python智能語(yǔ)音模型whisper的移植版本,依賴項(xiàng)少,內(nèi)存占用低,性能更優(yōu),方便作為依賴庫(kù)集成的到應(yīng)用程序中提供語(yǔ)音識(shí)別功能。 以下基于whisper.cpp的源碼利用C++ api來(lái)開(kāi)發(fā)實(shí)例demo演示讀取本地音頻文件

    2024年02月20日
    瀏覽(22)
  • 《AI上字幕》基于openAI研發(fā)的whisper模型,語(yǔ)音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時(shí)間軸/支持多語(yǔ)言/自帶翻譯《桌面版教程》

    《AI上字幕》基于openAI研發(fā)的whisper模型,語(yǔ)音(視頻)一鍵轉(zhuǎn)文本/字幕/帶時(shí)間軸/支持多語(yǔ)言/自帶翻譯《桌面版教程》

    OpenAI的chatGPT非常火爆,其實(shí)OpenAI旗下的另一個(gè)模型實(shí)力也十分強(qiáng)大,它就是開(kāi)源免費(fèi)的Whisper語(yǔ)音轉(zhuǎn)文本模型,目前為止它是較為頂尖的語(yǔ)音轉(zhuǎn)文本模型 當(dāng)前github上也有許多出色的開(kāi)發(fā)者根據(jù)此模型開(kāi)發(fā)出桌面版語(yǔ)音轉(zhuǎn)文字應(yīng)用。較為出色的分別是Buzz和WhisperDesktop 支持將多種

    2023年04月19日
    瀏覽(24)
  • 基于PyQt5GUI的人臉識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    基于PyQt5GUI的人臉識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    目 錄 前 言 1 第 1 章 人臉識(shí)別系統(tǒng)概述 1 第 2 章 人臉檢測(cè)技術(shù) 1 §2.1 基于 Harr 級(jí)聯(lián)的人臉檢測(cè) 2 §2.2 基于 face_recognition 開(kāi)源庫(kù)的人臉檢測(cè)… 錯(cuò)誤!未定義書簽。第 3 章 人臉識(shí)別技術(shù) 5 §3.1 構(gòu)造人臉數(shù)據(jù)集 5 §3.2 模型訓(xùn)練 7 §3.3 實(shí)時(shí)人臉識(shí)別 9 第 4 章 基于 PyQt5 的應(yīng)用平臺(tái) 1

    2024年02月04日
    瀏覽(27)
  • 基于PyQt5的圖形化界面開(kāi)發(fā)——隊(duì)列動(dòng)畫演示

    基于PyQt5的圖形化界面開(kāi)發(fā)——隊(duì)列動(dòng)畫演示

    本文使用PyQt5制作圖形化界面演示數(shù)據(jù)結(jié)構(gòu)中的 隊(duì)列 操作,與上一節(jié)隊(duì)列動(dòng)畫相對(duì)應(yīng) 基于PyQt5的圖形化界面開(kāi)發(fā)——隊(duì)列動(dòng)畫演示 操作系統(tǒng):Windows10 專業(yè)版 開(kāi)發(fā)環(huán)境:Pycahrm Comunity 2022.3 Python解釋器版本:Python3.8 第三方庫(kù):PyQt5 隊(duì)列(Queue)是一種常用的數(shù)據(jù)結(jié)構(gòu),類似于現(xiàn)

    2024年02月07日
    瀏覽(23)
  • 基于PyQt5的UI界面開(kāi)發(fā)——信號(hào)與槽

    基于PyQt5的UI界面開(kāi)發(fā)——信號(hào)與槽

    PyQt5采用了一種被稱為“信號(hào)與槽”機(jī)制的編程模式,用于處理對(duì)象間的通信和事件處理。在PyQt5中,信號(hào)(signal)是對(duì)象發(fā)出的特定事件,例如按鈕被點(diǎn)擊、文本被修改等。而槽(slot)是與信號(hào)相關(guān)聯(lián)的特定動(dòng)作或函數(shù)。當(dāng)信號(hào)被觸發(fā)時(shí),與之相關(guān)聯(lián)的槽會(huì)被自動(dòng)調(diào)用。 槽

    2024年02月16日
    瀏覽(22)
  • 語(yǔ)音翻譯項(xiàng)目(Whisper,opencc,Baidu翻譯API,edge_tts)

    定制程序開(kāi)發(fā) heguannan @ 163.com 國(guó)內(nèi)天生有墻,海外與國(guó)內(nèi)的視頻平臺(tái)不連通,視頻搬運(yùn)業(yè)務(wù)應(yīng)運(yùn)而生。 通過(guò)國(guó)內(nèi)的視頻搬運(yùn)到海外平臺(tái)或者將海外平臺(tái)視頻搬運(yùn)到國(guó)內(nèi),以獲得平臺(tái)的報(bào)酬。 當(dāng)然,可以直接采用成熟的API直接做到 漢語(yǔ)語(yǔ)音-英語(yǔ)語(yǔ)音。然而,大多數(shù)API都要收費(fèi)

    2024年02月12日
    瀏覽(43)
  • 解析!1V1直播源碼開(kāi)發(fā)搭建技術(shù)實(shí)時(shí)語(yǔ)音識(shí)別翻譯功能的應(yīng)用

    解析!1V1直播源碼開(kāi)發(fā)搭建技術(shù)實(shí)時(shí)語(yǔ)音識(shí)別翻譯功能的應(yīng)用

    ? 語(yǔ)言是我們?nèi)祟惤涣鞯墓ぞ?,它的種類繁多,比如世界語(yǔ)言,像是中國(guó)的漢語(yǔ)、英國(guó)的英語(yǔ)、法國(guó)的法語(yǔ)等;又或是我們中國(guó)的方言,像是山東話、北京話、上海話等??芍^是五花八門,爭(zhēng)奇斗艷,每一種世界語(yǔ)言或是方言都有他獨(dú)特的風(fēng)格,但語(yǔ)言種類繁多的同時(shí),這也

    2024年02月16日
    瀏覽(24)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包