国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

這篇具有很好參考價值的文章主要介紹了泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

最近在做AIGC的項目,不過是與圖片相關(guān)的,現(xiàn)在的模型效果可比前幾年圖片替換效果好多了。之前嘗試過用 faceswap 工具來進(jìn)行人臉替換的,具體可以參看下我之前的這篇文章:https://blog.csdn.net/sinat_26918145/article/details/79591717

?文章來源地址http://www.zghlxwxcb.cn/news/detail-459682.html

現(xiàn)代的模型對于圖生圖的支持效果已經(jīng)非常好了,相信對于美術(shù)行業(yè),這是一場影響很深遠(yuǎn)的變革。也許我們正站在一個新的時代交叉路口,可能多年后回憶起當(dāng)下的一瞬間,才后知后覺我們經(jīng)歷了一段什么樣的時代開端。

好了,回到主題,這一篇文章主要是介紹如何使用音頻模型,轉(zhuǎn)換成你想要的歌手聲音,得益于AI孫燕姿的火爆全網(wǎng),讓我也迫切想嘗試一下 AIsong 歌曲轉(zhuǎn)換。

目前來說比較火的開源 SVC 主要有以下幾種:

  • rvc: https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
  • diff-svc: https://github.com/prophesier/diff-svc
  • so-vits-svc: https://github.com/svc-develop-team/so-vits-svc

語音轉(zhuǎn)換的目標(biāo)是將源語音轉(zhuǎn)換為目標(biāo)語音,保持內(nèi)容不變。提出了自監(jiān)督表示學(xué)習(xí)用于語音轉(zhuǎn)換

離散內(nèi)容編碼表示會丟失一些語言內(nèi)容,導(dǎo)致發(fā)音不準(zhǔn)確。為此,提出了通過預(yù)測離散單位分布學(xué)習(xí)的軟語音單位。通過建模,軟語音單位捕捉更多的內(nèi)容,提高了轉(zhuǎn)換語音的效果。

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?

在語音轉(zhuǎn)換系統(tǒng)架構(gòu)中,離散內(nèi)容編碼主要包含兩個部分的實(shí)現(xiàn):

  1. 離散內(nèi)容編碼器:將音頻特征聚類,生成一系列離散的語音單位序列
  2. 軟內(nèi)容編碼器:被訓(xùn)練用于預(yù)測離散語音單位

除此之外Acoustic model將離散/軟語音單位轉(zhuǎn)換為目標(biāo)聲譜圖。 vocoder語音合成器將聲譜圖轉(zhuǎn)換為音頻波形。

廢話不多說,前期鋪墊了這么多,我們下面直接開始操作~

?

一、前期準(zhǔn)備

剛開始模型訓(xùn)練前,我們需要搜集大量的目標(biāo)人物的音頻素材,如果是需要以你自己聲音為基礎(chǔ)的轉(zhuǎn)換模型,則需要錄制你自己的聲音。這里的素材多少會直接影響到你模型訓(xùn)練的質(zhì)量,一般建議提供 100 分鐘以上的人聲素材。

如果不是自己的聲音,建議可以去網(wǎng)上搜集需要的人聲音頻。我這邊使用的是阿B上的視頻素材,這里可以使用這里推薦的工具(傳送門),直接下載對應(yīng)的視頻or音頻,非常方便~

這里我下載了差不多100分鐘的音頻

泰褲辣!?。∈置纸虒W(xué),如何訓(xùn)練一個你的專屬AI歌姬~

準(zhǔn)備好音頻素材后,需要對音頻文件進(jìn)行人聲和背景音的分離,因為背景音對于模型的訓(xùn)練有干擾,單純的人聲可以讓模型的聲音效果和目標(biāo)更擬合。這里使用到的工具是?demucs

安裝:

pip install -U demucs

分離人聲和背景音

demucs "音頻文件地址" -o "輸出文件目錄" -n mdx_extra --two-stems=vocals

生成后輸出文件目錄有兩個文件,一個是人聲,一個是背景音

泰褲辣?。。∈置纸虒W(xué),如何訓(xùn)練一個你的專屬AI歌姬~

把所有的音頻文件都進(jìn)行人聲分離后,接下來就要對音頻進(jìn)行切片處理了,因為人聲素材文件的大小過大會影響模型訓(xùn)練的速度,所以我們還需要對其切片,將它變成一個比較小的人聲切片文件。這里使用的工具是?audio-slicer

https://github.com/openvpi/audio-slicer?

git clone https://github.com/flutydeer/audio-slicer.git
cd ./audio-slicer
pip install -r requirements.txt
python ./slicer-gui.py

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?

二、模型訓(xùn)練

模型訓(xùn)練主要是使用的是?https://github.com/svc-develop-team/so-vits-svc/tree/4.1-Stable

你可以在自己的顯卡上訓(xùn)練,也可以在云端上進(jìn)行鍛煉。因為我本機(jī)電腦的顯卡不行,所以使用云端的服務(wù)器來進(jìn)行訓(xùn)練。參考了很多教程,感覺很多博主都推薦 AutoDL 這個平臺,所以我們也使用這個,避免走彎路~

這里租用一臺 v100 的算力服務(wù)器

泰褲辣?。。∈置纸虒W(xué),如何訓(xùn)練一個你的專屬AI歌姬~

鏡像這里選擇:

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

選擇 v3 或者 v4 模型都可以

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

買完之后進(jìn)入控制臺,接下來就是使用網(wǎng)盤把我們處理過的人聲素材導(dǎo)入到實(shí)例容器中

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

點(diǎn)擊“AutoPanel”進(jìn)入控制臺

泰褲辣?。。∈置纸虒W(xué),如何訓(xùn)練一個你的專屬AI歌姬~
泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?可以先把訓(xùn)練數(shù)據(jù)上傳到阿里云,在這里用阿里云app掃碼登錄。對需要上傳到容器內(nèi)的訓(xùn)練集文件夾,點(diǎn)擊下載,然后就可以自動同步到容器內(nèi)的這個文件夾目錄里的,整個過程耗時會稍微久一點(diǎn)。

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?至此,我們的數(shù)據(jù)集就全部準(zhǔn)備好了,下面就準(zhǔn)備訓(xùn)練了。

?

二、模型訓(xùn)練

回到我們的控制臺,點(diǎn)擊 JupyterLab 進(jìn)入容器內(nèi)

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

進(jìn)入 JupyterLab 后,打開項目內(nèi)的 README-v4.ipynb ,可以看到模型作者很細(xì)致的將模型訓(xùn)練每一步都做成了可視化操作的命令步驟解析。第一步就是我們的訓(xùn)練集從 /dataset 文件夾目錄,搬運(yùn)到 /dataset_raw。只需要鼠標(biāo)點(diǎn)擊模型作者第一步 [1]: 所標(biāo)識的python命令,然后點(diǎn)擊運(yùn)行按鈕即可,這個點(diǎn)擊后需要小小等待一會,它開始運(yùn)行時命令下面會有相關(guān)的輸出提示。

泰褲辣!??!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

在此文件夾目錄下,數(shù)據(jù)集就安放正確了。比如你訓(xùn)練數(shù)據(jù)集的文件夾名稱是 Paimondata 則會在此目錄下生成一個同樣的目錄,其實(shí)你可以直接把數(shù)據(jù)集導(dǎo)入到這里也行,不用網(wǎng)盤。

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?在文檔中也清楚的說明了,文件夾名稱就是你訓(xùn)練的人聲名字,可以放多個你想要訓(xùn)練的聲音目標(biāo)

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?

?第二步就是對數(shù)據(jù)集進(jìn)行采樣至 44100hz。第三步則是進(jìn)行自動劃分訓(xùn)練集。這兩部分也是一樣,按運(yùn)行按鈕執(zhí)行。

泰褲辣!?。∈置纸虒W(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?接下來就是對配置文件 /config/config.json 文件進(jìn)行配置,編輯后進(jìn)行修改:把 "learning_rate"改成 0.0004,把 "batch_size"改成24,把 "keep_ckpts"改成10,然后按Ctrl+S保存?。?!

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

learning_rate和batch_size這兩個參數(shù)可以理解為訓(xùn)練速度和訓(xùn)練質(zhì)量,因為我們用的V100 32G顯卡,這塊直接固定死數(shù)值就可以,keep_ckpts是保存多少個模型,因為聲音模型訓(xùn)練是不會自動停止的,每幾千步就會給你保存一個模型,所以我們可以讓他自動保存最新的10個模型讓我們來選一個最好的。

接著需要生成 hubert 和 f0,這里是后面推理的時候添加的輔助選項,為了修飾推理出來的音頻更加順滑

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

如果你是第一次訓(xùn)練,則無需進(jìn)行清理,直接跳到訓(xùn)練這一步就行了,不過在訓(xùn)練這里,按照文檔注釋的,使用終端來進(jìn)行訓(xùn)練命令的執(zhí)行。

泰褲辣!??!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~
在啟動頁點(diǎn)擊“終端”,進(jìn)入終端后就可以上面訓(xùn)練中的 Python 命令拿來執(zhí)行了

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?注意一下,這里需要在項目的當(dāng)前目錄才能執(zhí)行,如果不是項目目錄可以

cd ~/autodl-tmp/so-vite-svc

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

出現(xiàn)日志后就說明開始訓(xùn)練了,可以看到每訓(xùn)練200步,train.log 日志就記錄相關(guān)的日志,也就是控制臺中的輸出。沒當(dāng)800步的時候就會保存一個模型,工程會默認(rèn)保存最新的十個模型,模型目錄如下

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

然后我們可以等待它的模型了,一般達(dá)到10000步的時候效果會比較好一些,這個過程差不多五個小時,這時候咱們可以去吃飯喝茶遛彎干別的事情了,哪怕關(guān)掉電腦都行,訓(xùn)練命令并不會因為與 autodl 的網(wǎng)頁連接中斷而停止,所以不用擔(dān)心。

?

三、聲音推理

這里網(wǎng)上的教程都是說把模型文件拉取到本地來進(jìn)行推理,但是個人不太建議這樣子做,因為本地的python環(huán)境需要安裝很多的依賴不說,還不一定能裝載成功,既然云端都提供了整個工程了,為什么不在云端進(jìn)行推理呢。云端推理有 webui 和 腳本 兩種方法,兩個我試過了,webui會出現(xiàn)推理失敗的情況,腳本就非常穩(wěn)定,能成功產(chǎn)出推理音頻。
和數(shù)據(jù)預(yù)處理一樣,我們需要把需要被轉(zhuǎn)換的音樂,進(jìn)行人聲和背景音的分離,使用我們上面的工具?demucs 來處理,步驟是一樣的。得到音樂的人聲后,我們把它放到云端工程的這個目錄下。
泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~
上圖中 vocals.wav 就是整首歌的人聲部分,這里因為音頻有四分鐘左右,整首進(jìn)行推理的話,會直接報內(nèi)存使用超過上限的錯誤,所以我又用上面提到的 auto-slicer 工具來進(jìn)行切分人聲,得到 0 到 5 個分片文件。
接下來打開終端,運(yùn)行一下命令:
python inference_main.py  -m "logs/44k/G_{模型編號}.pth" -c "configs/config.json" -n {raw目錄下需要轉(zhuǎn)換的人聲文件名} -t 0 -s {上面你數(shù)據(jù)訓(xùn)練集的文件夾名稱也就是文檔里的speaker name}

關(guān)于推理參數(shù),文檔有很詳細(xì)的描述

#用腳本推理 
!python inference_main.py 
#推理結(jié)果會存放在so-vits-svc/results文件夾
#如果不編輯推理腳本,參數(shù)直接附加在上面的指令后 
#如 !python inference_main.py -m "logs/44k/G_30400.pth" -c "configs/config.json"...
#每個參數(shù)需要用""括起來
#必填參數(shù)
#-m, --model_path:模型路徑。
#-c, --config_path:配置文件路徑。
#-n, --clean_names:wav 文件名列表,放在 raw 文件夾下。
#-t, --trans:音高調(diào)整,支持正負(fù)(半音)。
#-s, --spk_list:合成目標(biāo)說話人名稱。
#可填參數(shù)
#-a, --auto_predict_f0:語音轉(zhuǎn)換自動預(yù)測音高,轉(zhuǎn)換歌聲時不要打開這個會嚴(yán)重跑調(diào)。
#-cm, --cluster_model_path:聚類模型路徑,如果沒有訓(xùn)練聚類則隨便填。
#-cr, --cluster_infer_ratio:聚類方案占比,范圍 0-1,若沒有訓(xùn)練聚類模型則填 0 即可。

所有的推理產(chǎn)出都在 result 文件夾中

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~
可以一個一個的下載下來本地進(jìn)行播放,如果發(fā)現(xiàn)效果不好,則重新選擇模型進(jìn)行推理,一般來說訓(xùn)練次數(shù)越多,聲音的推理產(chǎn)出結(jié)果和訓(xùn)練的目標(biāo)對象越相似。
在本地后,你可以像我一樣用剪印或者其他的編輯軟件進(jìn)行音頻的合成。也就是把上面的推理結(jié)果和歌曲的背景音進(jìn)行重新剪輯合并。

泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~

泰褲辣!?。∈置纸虒W(xué),如何訓(xùn)練一個你的專屬AI歌姬~

?

最后的最后讓我們一起來聽一下成片吧~~~

鏈接: https://pan.baidu.com/s/1lwCvlZc91UYmPmtICksLIQ 提取碼: dezw?

?

到了這里,關(guān)于泰褲辣?。?!手摸手教學(xué),如何訓(xùn)練一個你的專屬AI歌姬~的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 手摸手帶你初探Vue 3.0

    距離Vue 3.0正式發(fā)布已經(jīng)過去一段時間了,2月7日Vue團(tuán)隊正式宣布Vue 3正式成為新的默認(rèn)版本。最近接觸的新項目也使用Vue 3.0來開發(fā),因此有必要對它進(jìn)行一波總結(jié)和學(xué)習(xí)。 在最開始的時候,Vue僅僅是一個運(yùn)行時庫。但經(jīng)過多年的發(fā)展,它已經(jīng)逐漸變成了一臺包含許多子項目的

    2024年02月16日
    瀏覽(24)
  • 【騰訊云Finops Crane集訓(xùn)營】利用云原生成本優(yōu)化項目實(shí)現(xiàn)降本增效泰褲辣~

    【騰訊云Finops Crane集訓(xùn)營】利用云原生成本優(yōu)化項目實(shí)現(xiàn)降本增效泰褲辣~

    Crane 是一個基于 FinOps 的云資源分析與成本優(yōu)化平臺。在保證客戶應(yīng)用運(yùn)行質(zhì)量的前提下實(shí)現(xiàn)極致的降本。 云原生技術(shù)可以幫助企業(yè)實(shí)現(xiàn)降本增效,提高業(yè)務(wù)的靈活性和可擴(kuò)展性。云原生技術(shù)的降本增效主要是由以下因素推動的: 成本壓力:隨著業(yè)務(wù)規(guī)模和數(shù)據(jù)量的不斷增長

    2024年02月05日
    瀏覽(19)
  • 手摸手帶你 在Windows系統(tǒng)中安裝Istio

    手摸手帶你 在Windows系統(tǒng)中安裝Istio

    通過負(fù)載均衡、服務(wù)間的身份驗證、監(jiān)控等方法,Istio 可以輕松地創(chuàng)建一個已經(jīng)部署了服務(wù)的網(wǎng)絡(luò),而服務(wù)的代碼只需很少更改甚至無需更改。 通過在整個環(huán)境中部署一個特殊的 sidecar 代理為服務(wù)添加 Istio 的支持,而代理會攔截微服務(wù)之間的所有網(wǎng)絡(luò)通信,然后使用其控制

    2024年02月06日
    瀏覽(23)
  • 手摸手教你寫任務(wù)中心-積分領(lǐng)取&消耗&回收

    手摸手教你寫任務(wù)中心-積分領(lǐng)取&消耗&回收

    繼上一篇簽到任務(wù)之后呢, 就有朋友讓我寫一下任務(wù)積分的領(lǐng)取和使用, 以及回收; 其實(shí)前面兩種都不難, 就只是積分的加減而已, 真正麻煩的是回收, 有回收的話你就需要考慮到每筆積分存在多種狀態(tài)的可能了; 明細(xì)表(mysql) 記錄積分的每一筆獲取, 消耗的回收的記錄, 并且回收

    2024年02月08日
    瀏覽(23)
  • 手摸手2-springboot編寫基礎(chǔ)的增刪改查

    手摸手2-springboot編寫基礎(chǔ)的增刪改查

    創(chuàng)建controller層 實(shí)現(xiàn) test 表中的添加、修改、刪除及列表查詢接口(未分頁) 添加service層接口 service層實(shí)現(xiàn) 添加mapper層 mapper層對應(yīng)的sql 添加掃描注解,對應(yīng)sql文件的目錄

    2024年02月10日
    瀏覽(14)
  • 不用魔法,快速、手摸手上線Midjourney!【附源碼】【示例】

    不用魔法,快速、手摸手上線Midjourney!【附源碼】【示例】

    首先來一波感謝: 感謝laf提供贊助,目前可以免費(fèi)使用Midjourney進(jìn)行開發(fā)和測試。 感謝白夜、米開朗基楊@sealos.io的耐心解答,讓我對laf有了更多的使用與了解。 什么是laf?來了解下。 文末有【示例】 廢話不多說,進(jìn)入正題。 laf在做一個活動,可以使用快速上手Midjourney《人

    2024年02月05日
    瀏覽(20)
  • 手摸手教你把Ingress Nginx集成進(jìn)Skywalking

    在微服務(wù)大行其道的今天,如何觀測眾多微服務(wù)、快速理清服務(wù)間的依賴、如何對服務(wù)之間的調(diào)用性能進(jìn)行衡量,成了擺在大家面前的難題。對此,Skywalking應(yīng)運(yùn)而生,它是托管在 Apache 基金會下的開源項目,旨在幫助開發(fā)者監(jiān)控分布式程序的性能、了解各個服務(wù)的調(diào)用關(guān)系和

    2024年04月23日
    瀏覽(18)
  • 手摸手接入Github實(shí)現(xiàn)Oauth2第三方登錄

    手摸手接入Github實(shí)現(xiàn)Oauth2第三方登錄

    最近在學(xué)習(xí)oauth2授權(quán)登錄流程,oauth2簡單來說就是接入第三方應(yīng)用(qq、微信、github、gitee等),不用在本站登錄,而是去請求第三方應(yīng)用的用戶信息完成登錄。 下面就一起來看一下如何接入github實(shí)現(xiàn)第三方登錄 首先,我們需要在github中添加OAuth App,登錄你的github(如果還有

    2024年02月04日
    瀏覽(26)
  • 【Java之JAR包解析】(一)如果你也跟我一樣搞懂了rt.jar,那真的泰褲辣! · 上篇~

    【Java之JAR包解析】(一)如果你也跟我一樣搞懂了rt.jar,那真的泰褲辣! · 上篇~

    JAR (Java ARchive) 是一種 Java 打包文件格式,它可以 將一組 Java 類文件、相關(guān)資源和元數(shù)據(jù)打包到一個單獨(dú)的文件中 。JAR 文件通常用于分發(fā) Java 應(yīng)用程序或庫,并且可以在不同平臺上運(yùn)行。 JAR 包是一種方便的方式來組織和管理 Java 代碼和依賴項,并且可以輕松地與其他開發(fā)人

    2024年02月04日
    瀏覽(21)
  • 手摸手教你Vite+Vue3項目初始化及開源部署到GItee

    手摸手教你Vite+Vue3項目初始化及開源部署到GItee

    本片文章主要記錄項目的環(huán)境,項目搭建。 在開始本次學(xué)習(xí)中,鑒于你有前端三件套和vue的知識基礎(chǔ)。 文檔創(chuàng)建于2023年5月20日,大家都去過情人節(jié)了~我在肝代碼! 環(huán)境的搭建 node版本使用18.16.0。 目前(2023.05.20)的穩(wěn)定版本,這里推薦使用nvm來管理node的版本。Nvm使用教程

    2024年02月04日
    瀏覽(40)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包