本教程教你怎么使用工具訓(xùn)練數(shù)據(jù)集推理出你想要轉(zhuǎn)換的聲音音頻,并且教你處理剪輯伴奏和訓(xùn)練后的音頻合并一起,在文章的最后有用我自己聲音處理的歌曲,哎喲,還怪不好意思的~,哈哈,快來試試看把!
DDSP-SVC3.0訓(xùn)練推理克隆聲音,超物有所值,訓(xùn)練完畢有伴奏處理教程哦
1.使用的工具
要想訓(xùn)練ai聲音,首先需要有各種工具,還需要我們提供你需要訓(xùn)練的聲音,當(dāng)然聲音需要沒有噪音存干聲,如果要是歌曲就需要分離歌曲的背景和聲音,然后將音頻文件切分,切分的目的是為了保證訓(xùn)練不卡,否則音頻文件太大,所以你知道我們需要什么工具了把!以下揭曉
Adobe Audition :我主要用這個提取mp4的音頻文件,后期可以用這個剪輯將伴奏和音頻合起來
UVR5:這個是專門背景與人生分離的軟件,一鍵安裝就可以
Audio Slicer(音頻切分):這個可以不用專門下軟件自己操作了,大神在webui里集成了,按一下自動切分。
DDSP-SVC-3.0:最重要的工具,啟動后是個webui界面,然后呢我們需要在里邊訓(xùn)練自己的聲音,轉(zhuǎn)換聲音等操作。
整合包使用b站大佬羽毛布團(tuán)提供的包-地址: https://pan.baidu.com/s/1DWqVpJ7b6ueoUv6h4yF1-A?pwd=ddsp
處理音頻的工具可以去羽毛布團(tuán)的這個整合包下載,注意不要下載so-svc文件哦: https://pan.baidu.com/s/12u_LDyb5KSOfvjJ9LVwCIQ?pwd=g8n4
2.素材準(zhǔn)備
2.1 AU提取音頻
將mp4提取音頻文件,用AU操作,操作如下:
我是要把我在bilibili錄制的視頻下載下來的,需要借助bilibili的一些工具才能下載下來視頻,我用的是這個在線解析bilibili視頻的還是蠻方便的,鏈接在這里。
嗶哩嗶哩(bilibili)視頻解析下載 - 保存B站視頻到手機(jī)、電腦
然后得到的視頻可以拖到如下的位置,
然后點擊這個文件右鍵將音頻提取到文件,然后點擊新出的音頻文件再點擊最上面的菜單文件保存或另存為然后就得到音頻文件了。
2.2 UVR5提取干聲
下面提取說明按需去取。
音頻如果比較純的聲音無噪音則直接可以切分音頻了,如果不純的化可以處理下,打開url5,
這個是處理伴奏和人聲分離的。
伴奏人聲分離以后可以去聽聽純聲,發(fā)現(xiàn)其實會有一些和聲和混響的,我們要去去掉這個和聲混響,根據(jù)下面操作。
如果不是唱歌而是干聲去噪也可以使用如下這種方式處理看看效果,我是純的背景有點噪音,然后用了去和聲混響處理的,也是有點效果的。
3.啟動DDSP-SVC
聲音部分都處理完了,就可以啟動webui了,進(jìn)入DDSP-SVC-3.0目錄,雙擊啟動啟動WebUI,然后彈出來一個cmd彈框,
復(fù)制這個路徑打開webui?
webui的界面是這樣的
3.1 音頻切分
這時就可以音頻切分了,按照下面的說明去處理。
切分后的文件。?
找到切分后的輸出目錄然后全部將塊音頻全部復(fù)制到此目錄下:DDSP-SVC-3.0\data\train\audio
然后就需要到webui界面下,這時需將DDSP-SVC-3.0\data\train里的音頻以100:1的比例放入到此目錄下:DDSP-SVC-3.0\data\val\audio,100:1就是100個文件里取一個這樣的比例,也可以不用你自己挑,程序幫你挑完自己放入對應(yīng)的校驗集里也就是val目錄下,程序操作如下:
3.2 數(shù)據(jù)預(yù)處理?
數(shù)據(jù)預(yù)處理,這里也很快,按下面的說明進(jìn)行填寫,填寫哪些都有注釋,點擊數(shù)據(jù)預(yù)處理就可以了。
3,3 訓(xùn)練前的參數(shù)設(shè)置
設(shè)置要訓(xùn)練的參數(shù),其實都默認(rèn)就行,但是配置低的要進(jìn)行相應(yīng)的更改,否則訓(xùn)練過程中會失敗。然后點擊寫入配置文件就可以了,此時輸出信息說寫入配置完成就OK了。
?
3.4 開始訓(xùn)練
3.4.1 DDSP模型訓(xùn)練
然后就開始訓(xùn)練了,?一般是先訓(xùn)DDSP這個是比較重要的,第一次訓(xùn)練的化需要選擇從頭開始訓(xùn)練,如果訓(xùn)練過程中取消了,那么想要繼續(xù)訓(xùn)練就選擇繼續(xù)上一次的訓(xùn)練進(jìn)度,然后取消模型訓(xùn)練時一定要按照這個倍數(shù)取消“每隔多少步(steps)驗證并保存一次模型(2000步)”,否則可能沒保存上,
然后彈出cmd,一直在迭代步數(shù)中,代表訓(xùn)練中
?觀察loss值,無明顯趨勢覺得不需要訓(xùn)練就可以按取消了,ctrl+c就會取消訓(xùn)練
訓(xùn)練完了就可以訓(xùn)練擴(kuò)散模型了,報如下錯需要修改fp16需要改成fp32了。
?
?可以看訓(xùn)練趨勢圖,啟動Tensorboard,按下面這個操作就可以了,倒時會告訴你地址。
就會出現(xiàn)這樣的界面
3.4.2 擴(kuò)展模型訓(xùn)練
DDSP訓(xùn)練完畢,我們開始訓(xùn)練擴(kuò)散模型。如下方式這樣就可以了,cmd和上面的ddsp是一樣的,感覺差不多了就取消訓(xùn)練。都訓(xùn)練完畢了就到推理環(huán)節(jié)了。
訓(xùn)練好的模型在這里會出現(xiàn),此目錄:DDSP-SVC-3.0\exp
DDSP的在這個目錄下,可以看到模型訓(xùn)練的步數(shù)
?擴(kuò)散訓(xùn)練的在這個地方
4.模型推理?
兄弟們最后一步了,堅持住?。?/p>
推理就選擇我們自己訓(xùn)練的模型,選擇音頻,按下面的圖片的步驟走,按順序來就行。
?4.1 音頻轉(zhuǎn)換
重點來了,開始聲音替換?,我第一次處理時間巨長,也看不到日志后來關(guān)掉重啟,重試關(guān)掉重啟幾次,突然出現(xiàn)了日志,以及處理過程,然后很快就推理完成了,聽了下,效果還行,我的數(shù)據(jù)集還行,40分鐘差不多,訓(xùn)練步數(shù)7500步也不多,然后我的聲音全部是說話,沒有唱歌聲音,最后出現(xiàn)的這個效果還行,有一點點感覺到ai的感覺,不知道是不是這個哥以及歌手唱腔的原因。
推理過程。
?5.讓AI唱歌
我的音頻是《慢慢喜歡你》這首歌的干聲,然后把我的聲音替換上去,轉(zhuǎn)換了以后《慢慢喜歡你》就是我的聲音了,接下來就需要把伴奏和我處理后的聲音合在一起,打開AU這個軟件就可以了
選擇多軌道
然后將伴奏文件和處理好的音頻拖入進(jìn)來,干聲放入第一軌道,伴奏放入第二軌道,對齊就好
?然后點擊文件導(dǎo)出-多軌混音-整個會話就可以了。記得自己指定輸出目錄哦!
來欣賞作品把:
訓(xùn)練22000步的效果:
《漫步人生路》
笑對滄桑,漫步人生路,不問前程幾何。
《以渺小愛你》一路前行環(huán)保公益曲,最近非常喜歡
??由AI譜唱,一路向前,這首環(huán)保公益主題曲真的太治愈了!
訓(xùn)練7500步的效果:
《漠河舞廳》
??AI唱漠河舞廳,實現(xiàn)個人錄音棚了!??
《慢慢喜歡你》文章來源:http://www.zghlxwxcb.cn/news/detail-777160.html
「搞事情」了!我用自己的聲音訓(xùn)練AI唱《慢慢喜歡你》文章來源地址http://www.zghlxwxcb.cn/news/detail-777160.html
到了這里,關(guān)于DDSP-SVC-3.0完全指南:一步步教你用AI聲音開啟音樂之旅的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!