国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

分享一款剛開源的音樂人聲分離工具!無需聯(lián)網(wǎng)!頁面化操作!

這篇具有很好參考價(jià)值的文章主要介紹了分享一款剛開源的音樂人聲分離工具!無需聯(lián)網(wǎng)!頁面化操作!。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

前言

人聲分離 是一項(xiàng)重要的音頻處理技術(shù),它可以將混合音頻中的 人聲和背景音樂 分離出來,為音頻處理和后期制作提供了便利。

隨著人聲分離技術(shù)的發(fā)展,越來越多的開源工具被開發(fā)出來,為音頻處理領(lǐng)域帶來了新的發(fā)展機(jī)遇。小編之前也體驗(yàn)過不少人聲分離 開源項(xiàng)目工具。分離效果有好的,有差的,參差不齊。

今天又逛到一塊剛剛開源的人聲分離工具 vocal-separate,看小樣示例還不錯(cuò),而且部署也比其他GPT產(chǎn)品簡(jiǎn)單些,還有編譯好的Windows版工具可直接使用。

vocal-separate-v0.0.4,copilot,音視頻,開源軟件

項(xiàng)目簡(jiǎn)介

vocal-separate 是一款極簡(jiǎn)的人聲和背景音樂分離工具??芍苯颖镜鼐W(wǎng)頁化操作,無需連接外網(wǎng),使用了 2stems/4stems/5stems 模型。

項(xiàng)目地址:https://github.com/jianchang512/vocal-separate

支持視頻(mp4/mov/mkv/avi/mpeg)和音頻(mp3/wav)格式。

vocal-separate-v0.0.4,copilot,音視頻,開源軟件

使用方法

1、預(yù)編譯Win版
  • 直接在項(xiàng)目Release頁面下載預(yù)編譯文件

vocal-separate-v0.0.4,copilot,音視頻,開源軟件

  • 解壓到本地某目錄下,如:E:\vocal-separate

  • 雙擊 start.exe ,等待自動(dòng)打開瀏覽器窗口

vocal-separate-v0.0.4,copilot,音視頻,開源軟件

  • 點(diǎn)擊頁面中的上傳區(qū)域,在彈窗中找到想分離的音視頻文件,或直接拖拽音頻文件到上傳區(qū)域,然后點(diǎn)擊“立即分離”,稍等片刻,底部會(huì)顯示每個(gè)分離文件以及播放控件,點(diǎn)擊播放。

vocal-separate-v0.0.4,copilot,音視頻,開源軟件

  • 如果電腦擁有英偉達(dá)GPU,并正確配置了CUDA環(huán)境,將自動(dòng)使用CUDA加速
2、源碼部署(Linux/Mac/Window)

要求 python 3.9->3.11

1)拉取 vocal-separate 拉取源碼到指定目錄

git clone git@github.com:jianchang512/vocal-separate.git

2)創(chuàng)建Python虛擬環(huán)境(根據(jù)本地安裝的虛擬env軟件來)

3)激活環(huán)境

# win下命令
%cd%/venv/scripts/activate      
# linux和Mac下命令    
source ./venv/bin/activate

4)安裝依賴

pip install -r requirements.txt

5)ffmpeg工具準(zhǔn)備

win下解壓 ffmpeg.7z,將其中的ffmpeg.exe和ffprobe.exe放在項(xiàng)目目錄下

linux和mac 到 ffmpeg官網(wǎng)下載對(duì)應(yīng)版本ffmpeg,解壓其中的ffmpeg和ffprobe二進(jìn)制程序放到項(xiàng)目根目錄下

6)下載模型壓縮包

在項(xiàng)目根目錄下的 pretrained_models 文件夾中解壓,解壓后,pretrained_models中將有3個(gè)文件夾,分別是2stems/3stems/5stems

7)執(zhí)行 python start.py ,等待自動(dòng)打開本地瀏覽器窗口。

網(wǎng)頁打開后,跟Win編譯版使用方法一樣。

具體使用詳情

將一首歌曲或者含有背景音樂的音視頻文件,拖拽到本地網(wǎng)頁中,即可將其中的人聲和音樂聲分離為單獨(dú)的音頻wav文件,可選單獨(dú)分離“鋼琴聲”、“貝斯聲”、“鼓聲”等。

自動(dòng)調(diào)用本地瀏覽器打開本地網(wǎng)頁,模型已內(nèi)置,無需連接外網(wǎng)下載。

只需點(diǎn)兩下鼠標(biāo),一選擇音視頻文件,二啟動(dòng)處理。

總結(jié)

作者將相關(guān)資源包,部署依賴都說的非常詳細(xì),直接根據(jù)步驟一步步安裝即可。針對(duì)單獨(dú)的音樂原聲分離效果還是Ok的。如果是視頻、影視、音樂等混合,可能還不是特別完美,還有優(yōu)化的空間。文章來源地址http://www.zghlxwxcb.cn/news/detail-816984.html

到了這里,關(guān)于分享一款剛開源的音樂人聲分離工具!無需聯(lián)網(wǎng)!頁面化操作!的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Github:分享一款開源的跨平臺(tái)多功能遠(yuǎn)程控制和監(jiān)控工具Spark

    Github:分享一款開源的跨平臺(tái)多功能遠(yuǎn)程控制和監(jiān)控工具Spark

    Github:分享一款開源的跨平臺(tái)多功能遠(yuǎn)程控制和監(jiān)控工具Spark,github,開源,spark

    2024年02月19日
    瀏覽(27)
  • 【實(shí)用的開源項(xiàng)目】使用服務(wù)器部署Navidrome音樂服務(wù)器,又一款開源的音樂服務(wù)器程序!

    【實(shí)用的開源項(xiàng)目】使用服務(wù)器部署Navidrome音樂服務(wù)器,又一款開源的音樂服務(wù)器程序!

    之前小俊給大家介紹過 Koel 音頻流服務(wù),就是為了解決大家的這個(gè)問題:下載下來的音樂,只能在本機(jī)欣賞,難以在多設(shè)備共享,如果自己搭建一個(gè)音樂服務(wù)器,然后再上傳自己喜歡的音樂,就太巴適了!小俊最近發(fā)現(xiàn)了一個(gè)程序—— Navidrome ,小俊這就來推薦給大家啦!還

    2024年04月16日
    瀏覽(19)
  • 音頻降噪之人聲分離

    音頻降噪之人聲分離

    集成目前最先進(jìn)的從音頻文件中分離人聲的源分離模型。 本工程,將Ultimate Vocal Remover GUI v5.5.1界面工具,改寫成可以在服務(wù)器端批量推理的工具。 界面?zhèn)}庫地址:https://github.com/Anjok07/ultimatevocalremovergui 暫不支持兩種模型聯(lián)合處理。 (1)VR Architecture: 具有9種模式的模型,這些

    2024年02月16日
    瀏覽(17)
  • 分享一款開源的QT的串口示波器

    分享一款開源的QT的串口示波器

    分享一款開源的QT的串口示波器,完全開源,支持串口、TCP、波形顯示、通信協(xié)議。 支持傳統(tǒng)的串口調(diào)試助手的基本收發(fā)功能,同時(shí)可以刷新大量的數(shù)據(jù)而不卡頓 支持保存接收的數(shù)據(jù) 支持最大200條可編輯指令的設(shè)置,并用于多條發(fā)送 支持定時(shí)器發(fā)送 支持換行符替換時(shí)間戳功

    2024年02月07日
    瀏覽(12)
  • 分享一款嵌入式開源按鍵框架代碼工程MultiButton

    分享一款嵌入式開源按鍵框架代碼工程MultiButton

    MultiButton 是一個(gè)小巧簡(jiǎn)單易用的事件驅(qū)動(dòng)型按鍵驅(qū)動(dòng)模塊。 Github地址:https://github.com/0x1abin/MultiButton 這個(gè)項(xiàng)目非常精簡(jiǎn),只有兩個(gè)文件: (1)可無限擴(kuò)展按鍵; (2)按鍵事件的回調(diào)異步處理方式可以簡(jiǎn)化程序結(jié)構(gòu),去除冗余的按鍵處理硬編碼,讓按鍵業(yè)務(wù)邏輯更清晰。 通

    2024年04月15日
    瀏覽(29)
  • 分享一款基于web的開源word文檔編輯器

    分享一款基于web的開源word文檔編輯器

    hi, 大家好, 我是徐小夕, 最近在研究基于 web 的文檔編輯器,在網(wǎng)上調(diào)研了很多方案, 剛好看到了一款非常有意思的開源編輯器—— canvas-editor , 它底層基于 canvas 實(shí)現(xiàn), 我們使用它可以實(shí)現(xiàn)類似于 word 文檔編輯器類似的效果, 同時(shí)還支持很多靈活可配置的 API , 可以幫助我們定制屬

    2024年03月26日
    瀏覽(23)
  • Fooocus-開源AI繪畫工具 無需繁瑣配置 一鍵下載安裝

    Fooocus-開源AI繪畫工具 無需繁瑣配置 一鍵下載安裝

    Fooocus是一款免費(fèi)開源的AI繪畫工具,基于SDXL模型在SD webui的基礎(chǔ)上進(jìn)行了改進(jìn),提供了一系列強(qiáng)大功能,并提供直觀易懂的界面,離線、開源、免費(fèi),無需手動(dòng)調(diào)整參數(shù)等等,一鍵下載安裝,用戶只需關(guān)注 prompts 和 images,目前支持Windows和Linux,而且Fooocus 包含并自動(dòng)化了許多

    2024年02月09日
    瀏覽(16)
  • 好用工具分享 | tmux 終端會(huì)話分離工具

    目錄 1 tmux的安裝 2 tmux的基本操作 2.1 啟動(dòng)與退出 2.2 分離會(huì)話 2.3 查看會(huì)話 2.4 重接會(huì)話 2.5 殺死會(huì)話 2.6 切換會(huì)話 tmux是一個(gè) terminal multiplexer(終端復(fù)用器),它可以啟動(dòng)一系列終端會(huì)話。 我們使用命令行時(shí),打開一個(gè)終端窗口,會(huì)話開始,執(zhí)行某些命令如npm run dev,關(guān)閉此終

    2024年02月07日
    瀏覽(40)
  • C# 關(guān)于進(jìn)程回收管理的一款工具設(shè)計(jì)與分享

    C# 關(guān)于進(jìn)程回收管理的一款工具設(shè)計(jì)與分享

    目錄 設(shè)計(jì)初衷 開發(fā)運(yùn)行環(huán)境 Craneoffice ProcessGC 運(yùn)行主界面 管理任務(wù)與策略 其它設(shè)置 移動(dòng)存儲(chǔ)設(shè)備管理 核心代碼-計(jì)時(shí)器監(jiān)控 小結(jié) 在使用 COM 模式操作 OFFICE 組件的開發(fā)過程中,當(dāng)操作完相關(guān)文檔后,在某些情況下仍然無法釋放掉 Word 或 EXCEL 等應(yīng)用進(jìn)程,因此根據(jù)進(jìn)程活動(dòng)情

    2024年04月17日
    瀏覽(23)
  • 嘗試開源一款mysql-es數(shù)據(jù)同步工具

    shigen 堅(jiān)持更新文章的博客寫手,擅長(zhǎng)Java、python、vue、shell等編程語言和各種應(yīng)用程序、腳本的開發(fā)。記錄成長(zhǎng),分享認(rèn)知,留住感動(dòng)。 mysql-es-synchronizer, 一款開源的輕量級(jí)MySQL數(shù)據(jù)增量同步到elasticsearch工具,只需簡(jiǎn)單的配置即可實(shí)現(xiàn)增量的數(shù)據(jù)同步。 MySQL和elasticsearch 的配

    2024年02月02日
    瀏覽(19)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包