? ? ?此項(xiàng)目主要包含三個(gè)功能(訊飛語(yǔ)音識(shí)別、百度文心一言問(wèn)答、metahumanSDK文字轉(zhuǎn)語(yǔ)音合成口型),所有功能均使用藍(lán)圖實(shí)現(xiàn),不含C++代碼。
項(xiàng)目所需插件;
Http通信插件;VaRest,在UE5中用于與文心一言建立連接,在Epic虛幻商城可免費(fèi)下載。
文字轉(zhuǎn)語(yǔ)音及合成口型動(dòng)畫(huà)插件;Metahuman SDK,在Epic虛幻商城可免費(fèi)下載。
語(yǔ)音識(shí)別插件;XunFeiSpeechToText,插件連接;??正在為您運(yùn)送作品詳情(該插件非本人所著,如需使用,需自行購(gòu)買(mǎi))
以下是該項(xiàng)目實(shí)現(xiàn)的全流程,僅供學(xué)習(xí)參考。
一、前期準(zhǔn)備
1.導(dǎo)入人物模型;打開(kāi)Quixel Bridge插件,如果沒(méi)有這個(gè)插件就去商城下載一個(gè),在其中選擇一個(gè)合適的人物模型,將其下載下來(lái)。人物模型也可自己進(jìn)行捏臉,需要上Metahuman官網(wǎng)進(jìn)行操作,捏完臉后點(diǎn)擊左下角按鈕進(jìn)行導(dǎo)出,然后在UE5中打開(kāi)Quixel Bridge插件,登錄后就可以看到自己捏臉的人物模型了,下載后在UE5的內(nèi)容瀏覽器中就可看到一個(gè)MetaHumans的文件,打開(kāi)文件,將人物模型的藍(lán)圖類(lèi)拖至場(chǎng)景中即可使用。
2、導(dǎo)入插件;在項(xiàng)目文件夾中新建Plugins目錄,將下載的XunFeiSpeechToText插件解壓到此目錄下。另外2個(gè)插件直接在虛幻商城下載后安裝到引擎即可,然后在插件中找到下載的插件,將其都打開(kāi),然后重啟項(xiàng)目。
二、實(shí)現(xiàn)訊飛語(yǔ)音識(shí)別功能
創(chuàng)建新關(guān)卡,然后保存關(guān)卡,再打開(kāi)關(guān)卡藍(lán)圖進(jìn)行編輯,圖中紅色款內(nèi)是定義的全局變量,可以將語(yǔ)音識(shí)別的文字存入該字符串中,以便其他地方使用,如果不需要讓語(yǔ)音識(shí)別的文字顯示在UI則可刪除該部分。
三、實(shí)現(xiàn)文心一言問(wèn)答功能
1、申請(qǐng)百度文心一言API,網(wǎng)址;百度智能云-登錄 (baidu.com)
注冊(cè)好賬號(hào)后,進(jìn)入計(jì)費(fèi)管理界面,開(kāi)通所需服務(wù),最好是都勾選,下面費(fèi)用高的可以不用勾選,只有你使用了才能計(jì)費(fèi)。
隨后點(diǎn)擊應(yīng)用接入,進(jìn)入此界面后點(diǎn)擊創(chuàng)建應(yīng)用按鈕,創(chuàng)建完成后就可以得到API Key和Secret Key。
2、編輯藍(lán)圖,將UE5與文心一言進(jìn)行通信連接
繼續(xù)在關(guān)卡藍(lán)圖中進(jìn)行編輯,創(chuàng)建四個(gè)變量,第一個(gè)Message變量的類(lèi)型為Va Rest Json Object數(shù)組、第二個(gè)為模型編號(hào)、第三個(gè)第四個(gè)為申請(qǐng)的API Key和Secret Key(將上面申請(qǐng)的2串代碼對(duì)應(yīng)賦給所創(chuàng)建的字符變量)紅色框內(nèi)的Content為需要輸入的問(wèn)題,將此與上一步語(yǔ)音識(shí)別的文字連接。
圖中紅色框內(nèi)的字符串就是文心一言返回的答案,這里同樣創(chuàng)建了一個(gè)全局變量,用來(lái)存儲(chǔ)文心一言回復(fù)的答案,方便其他地方調(diào)用。
四、metahumanSDK實(shí)現(xiàn)文字轉(zhuǎn)語(yǔ)音及口型合成
圖中紅色框?yàn)閙etahumanSDK文字轉(zhuǎn)語(yǔ)音的目標(biāo)文字,將上面文心一言傳回的答案與這個(gè)Text連接,圖中綠色框?yàn)樗枰谱骺谛偷娜宋锬P停趫?chǎng)景的大綱視口中將人物拖進(jìn)藍(lán)圖即可得到。
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-752539.html
以上就是此項(xiàng)目的全部實(shí)現(xiàn)流程了,最終效果還行,就是速度太慢,第一個(gè)點(diǎn)是文心一言,它是將所有答案一起傳回,字?jǐn)?shù)越多則等待的時(shí)間越長(zhǎng)。第二個(gè)點(diǎn)是metahumanSDK的文字轉(zhuǎn)語(yǔ)音和語(yǔ)音轉(zhuǎn)口型,同樣也是受字?jǐn)?shù)影響,字?jǐn)?shù)越多耗時(shí)越長(zhǎng),同時(shí)也要受網(wǎng)速的影響。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-752539.html
到了這里,關(guān)于UE5+數(shù)字人+文心一言實(shí)現(xiàn)語(yǔ)音問(wèn)答的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!