AI聲音克隆模型常見(jiàn)問(wèn)題匯總-學(xué)習(xí)筆記(附解決方法
聲明:
源碼非原創(chuàng),轉(zhuǎn)載自小破站UP主Jack-Cui,文章部分內(nèi)容來(lái)源網(wǎng)路,本文只用于技術(shù)分享,模型訓(xùn)練與語(yǔ)音輸出已測(cè)試成功。
硬件配置工具及運(yùn)行環(huán)境
CPU: i5-12490F
顯卡:七彩虹戰(zhàn)斧 RTX 4060 顯存8G # 網(wǎng)傳:A卡不行
內(nèi)存:16G
運(yùn)行系統(tǒng):Windows 10
Python版本:3.10.9
Python舊版本下載鏈接:https://www.python.org/downloads/windows/
名詞解釋:
batch_size:計(jì)算效率和內(nèi)存容量之間的平衡參數(shù)。若為高性能GPU,可以設(shè)置更大的batch_size值
epochs:所有樣本訓(xùn)練一遍。一個(gè)epoch是所有訓(xùn)練樣本的一輪正向傳遞和一輪反向傳遞。
舉例:假設(shè)訓(xùn)練數(shù)據(jù)集總共有1000個(gè)數(shù)據(jù)集,batch_size=10,樣本集需要100次迭代,完成1次epoch。
*問(wèn)題匯總(附解決方法
Part 1: 訓(xùn)練幾小時(shí)報(bào)錯(cuò)。
解決方法:比如設(shè)置了epoch為50,結(jié)果訓(xùn)練很久后報(bào)錯(cuò),可以看cmd的日志,是不是最后一條訓(xùn)練Epoch為50或者51.這種報(bào)錯(cuò)是模型訓(xùn)練已經(jīng)完成。直接關(guān)閉,啟動(dòng) 預(yù)測(cè)一鍵啟動(dòng).bat 即可
Part 2:CUDA相關(guān)報(bào)錯(cuò)
解決方法:這種一般是爆顯存,建議是音頻做下切片,每個(gè)wav不超過(guò)2分鐘,batch_size調(diào)小一下。
Part 3: Error Connection errored out.
解決方法:打開(kāi)報(bào)錯(cuò):Error Connection errored out. 建議檢查下代理服務(wù)器有沒(méi)有關(guān)掉,以及墻/VN/魔法上網(wǎng),有沒(méi)有關(guān)閉。
Part 4: 找不到系統(tǒng)指定路徑問(wèn)題
解決方法:一般這個(gè)是權(quán)限不夠,直接雙擊,或者用管理員身份打開(kāi)。如果是預(yù)測(cè)一鍵啟動(dòng).bat打不開(kāi),也有可能是模型沒(méi)有訓(xùn)練成功。
Part 5:開(kāi)始運(yùn)行后提示:音頻文件識(shí)別失敗
解決方法:這個(gè)是訓(xùn)練填寫(xiě)的路徑錯(cuò)誤,路徑不要包含中文,建議是直接在工程文件里面找到VITS_fast_finetune\raw_audio直接復(fù)制粘貼過(guò)去
Part 6:頁(yè)面文件太小,無(wú)法完成操作
解決方法:這個(gè)需要修改下虛擬內(nèi)存。建議改大一點(diǎn)。具體教程可以百度搜索
大概步驟:高級(jí)系統(tǒng)設(shè)置–點(diǎn)上邊高級(jí)–性能里面點(diǎn)設(shè)置–再點(diǎn)性能選項(xiàng)中高級(jí)–出來(lái)有個(gè)虛擬內(nèi)存更改按鈕–點(diǎn)擊進(jìn)去設(shè)置(根據(jù)自己硬件條件設(shè)置,比如D盤(pán)256G 我設(shè)置100G虛擬內(nèi)存
Part 7:bat 文件亂碼
解決方法:不要使用win11默認(rèn)的解壓軟件,解壓壓縮包,請(qǐng)使用WinRAR解壓。
解壓工具分享鏈接:https://pan.baidu.com/s/10QEYoeNoUem9hCkWzzQpaw
提取碼:9996
Part 8: ProcessExitedException 報(bào)錯(cuò) code 3221225477
process 0 terminated with exit code 3221225477
解決方法:報(bào)錯(cuò)原因是音頻通過(guò)腳本生成對(duì)應(yīng)的text文本中,句子太長(zhǎng)。簡(jiǎn)而言之還是爆顯存
個(gè)人解決方法:將wav文件做下前期處理,通過(guò)剪映將長(zhǎng)句子的片段裁剪掉
Up主解決方法:https://www.bilibili.com/video/BV13z4y1L74i/ 視頻4分鐘后就有講解該問(wèn)題。
Part 9:訓(xùn)練沒(méi)有進(jìn)度條,空跑項(xiàng)目
解決方法:檢查音頻raw_audio文件夾有沒(méi)有放到VITS_fast_finetune 工程目錄下
Part 10:運(yùn)行后網(wǎng)頁(yè)打不開(kāi)
解決方法:打開(kāi) finetune_webui.py 文件,修改最后兩行代碼,8088 改為 8089 或者其他端口。
Part 11:multiprocessing.spawn.ProcessExitedException: process 0 terminated with exit code 1
解決方法:這種異常報(bào)錯(cuò),直接打開(kāi) finetune_webui.py 文件,找到587行,將gr.Slider中第二個(gè)參數(shù)改成 10000,重新運(yùn)行代碼,在網(wǎng)頁(yè)端選擇epochs時(shí),調(diào)高點(diǎn)。
max_epochs = gr.Slider(2, 10000, value = 200, label = "訓(xùn)練epochs次數(shù)", info = "迭代訓(xùn)練的輪次,默認(rèn)200")
Part 12:路徑?jīng)]錯(cuò),點(diǎn)開(kāi)始訓(xùn)練完全沒(méi)反應(yīng),也沒(méi)打印流程
解決方法:檢查,檢查,檢查路徑中的音頻文件后綴是不是小寫(xiě)wav,文件后綴必須為小寫(xiě)!小寫(xiě)!小寫(xiě)的wav
Part 13: UnicodeEncodeError: ‘gbk‘ codec can‘t encode character(編碼問(wèn)題
解決方法:更新一下 pip,
更新指令:pip install --upgrade pip
然后win+R 輸入cmd,輸入
set PYTHONUTF8=1
Part 14:關(guān)于預(yù)測(cè)一鍵啟動(dòng).bat 運(yùn)行失敗問(wèn)題
解決方法:檢查路徑中是否含有中文,需要先運(yùn)行訓(xùn)練一鍵啟動(dòng).bat,訓(xùn)練好模型之后,關(guān)掉訓(xùn)練一鍵啟動(dòng).bat,只運(yùn)行預(yù)測(cè)一鍵啟動(dòng).bat,模型是不能分享,必須自己訓(xùn)練。
Part 15:關(guān)于重新訓(xùn)練模型
解決方法:分別刪除以下 目錄 里面的文件
denoised_audio
custom_character_voice
separated
segmented_character_voice
OUTPUT_MODEL
然后刪除工程目錄下的 txt 文件
final_annotation_train.txt
final_annotation_val.txt
另外:如果想繼續(xù)之前訓(xùn)練一般的模型,OUTPUT_MODEL目錄的文件不用刪除,僅刪除上面所述的其他文件。重新運(yùn)行代碼即可
Part 16:(待更新,可以在評(píng)論區(qū)留言…
有待更新…
個(gè)人使用總結(jié):
1.音頻文件盡量是5分鐘內(nèi)
2.效果與預(yù)期可能有點(diǎn)差距,只能到百分之80-90的效果
3.訓(xùn)練的時(shí)間需要很長(zhǎng)。建議先設(shè)置epochs=50試一下,是不是自己想要的效果,不滿意建議就換音源節(jié)省時(shí)間,個(gè)人測(cè)試后epochs=900與epochs=50 只是音質(zhì)完善一下。
4.訓(xùn)練模型中,最好使用干聲作為數(shù)據(jù)源
5.使用工具鏈接分享文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-790496.html
嗶哩嗶哩視頻解析下載:https://bilibili.iiilab.com/
在線視頻提取音頻:https://airmore.cn/extract-audio-online
在線轉(zhuǎn)換音頻文件:https://www.aconvert.com/cn/audio/文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-790496.html
創(chuàng)作不易,麻煩點(diǎn)個(gè)贊!感謝支持?。?/h2>
創(chuàng)作不易,麻煩點(diǎn)個(gè)贊!感謝支持?。?/h2>
創(chuàng)作不易,麻煩點(diǎn)個(gè)贊!感謝支持?。?/h2>
創(chuàng)作不易,麻煩點(diǎn)個(gè)贊!感謝支持?。?/h2>
到了這里,關(guān)于AI聲音克隆模型常見(jiàn)問(wèn)題匯總筆記(附解決方法,可評(píng)論區(qū)留言問(wèn)題技術(shù)交流的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!