伴隨ChatGPT的問世,在技術與商業(yè)運作上都日漸發(fā)展成熟的數(shù)字人產(chǎn)業(yè)正持續(xù)升溫。去年9月,北京市發(fā)布了國內(nèi)首個數(shù)字人產(chǎn)業(yè)專項支持政策,提出將依托國家文化專網(wǎng)將數(shù)字人納入文化數(shù)據(jù)服務平臺。以數(shù)字人、ChatGPT為代表的互聯(lián)網(wǎng)3.0創(chuàng)新應用產(chǎn)業(yè)機遇正迎面而來,美攝數(shù)字人系列產(chǎn)品助力企業(yè)打造專屬虛擬形象,快速接軌新賽道。
?
第一步,模型設計
美攝提供功能強大的數(shù)字人設計制造工具,設計師可以使用美攝的設計工具與C4D、Maya等工具配合進行數(shù)字人的形象設計,快速進行貼圖更換、效果調(diào)節(jié),實現(xiàn)高效設計。其中,美攝自研數(shù)字人設計工具與渲染器內(nèi)部使用同一套引擎,設計效果所見即所得,與最終渲染效果完全一致。設計制作出的模型效果可快速部署發(fā)布。
?
在自主設計之外,美攝還開發(fā)了“照片轉(zhuǎn)數(shù)字人”的快速形象生成方式。依靠人臉屬性分析和形象自動生成算法,對照片中的人物形象屬性如性別、年齡、臉型、五官特征、配飾等進行分析,并根據(jù)分析結(jié)果自動形成用戶專屬虛擬形象。在生成形象的基礎上,美攝提供多套男女發(fā)型、五官形狀效果方案,用戶可以在美攝數(shù)字人捏臉系統(tǒng)中進行精細調(diào)整。
第二步,形象渲染
美攝數(shù)字人設計使用自研三維圖形渲染引擎,具備強大的渲染能力,效果精細逼真,能夠真實再現(xiàn)人物皮膚、毛發(fā)、衣物的細節(jié),以及金屬、玻璃等材質(zhì)的質(zhì)感。
- 基于物理的材質(zhì)渲染(Physical-Based Rendering):效果更加逼真,材質(zhì)更加自然
- 實時陰影處理:讓數(shù)字人形象更加立體逼真
- 法向量貼圖:讓整體渲染效果更加清透,光感更好
- 支持全局環(huán)境光(Environment Lighting):三維渲染的光影效果可以根據(jù)實際場景隨時變化
- 屏幕空間環(huán)境光遮蔽(SSAO):真實渲染各凹凸細節(jié)處的明暗關系
- 仿真物理系統(tǒng):讓數(shù)字人的運動帶動佩飾、頭發(fā)等部分進行擬真晃動、彈跳、垂感等效果
第三步,唇音同步
美攝基于AI訓練建立了一套獨特的唇音分析算法,可以實現(xiàn)自然生動的形象展現(xiàn)。通過對輸入的語音進行輕量化AI分析,獲取實際人物的面部表情,再將AI算法輸出的結(jié)果與語音內(nèi)容結(jié)合,驅(qū)動數(shù)字人模型,實現(xiàn)實時的三維唇音同步效果。
第四步,表情動作設定
基于自研的Morphing技術,美攝渲染引擎支持多達54種人臉基礎表情。這些基礎表情相互組合,構成了擬真的數(shù)字人面部系統(tǒng),幾乎可以囊括所有的人臉表情,為數(shù)字人模型生動的表情展現(xiàn)奠定基礎。
而在動作方面,大致可以分成默認動作、問答類動作和提醒動作三類。默認動作是在無需任何應答時在屏幕上展現(xiàn)懸浮、旋轉(zhuǎn)、休息等預設動作,使數(shù)字人避免長期處于呆板的站立形態(tài),更加生動靈活。而問答類動作主要針對交互問答場景設置,當輸入特定文字語音時,數(shù)字人會在播報的同時進行相應的動作表達。文章來源:http://www.zghlxwxcb.cn/news/detail-479129.html
此外,結(jié)合具體的硬件特性,還可以設定特殊的提醒類動作。如應用在汽車、醫(yī)療硬件等設施中時,可以與硬件傳感器相結(jié)合,在接收到譬如上下車、設備故障、用戶疲勞等信號時,觸發(fā)數(shù)字人進行動作和語音提示,帶來更智能的交互體驗。至此,一個專屬數(shù)字人就制作完成了。文章來源地址http://www.zghlxwxcb.cn/news/detail-479129.html
到了這里,關于只需四步,手把手教你打造專屬數(shù)字人的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!