国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

這篇具有很好參考價值的文章主要介紹了快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

誰不想有一個可愛的數(shù)字人形象呢?在日常的工作和娛樂中,越來越多的數(shù)字人虛擬形象與大家見面,他們可以是主播,也可以是語音助手,還可以是你自己的虛擬寵物。只有更快更精準的生成數(shù)字人,才能讓數(shù)字人更加普及,普通消費者才能更多地接觸到數(shù)字人。LiveVideoStackCon 2022北京站邀請到了張瑞全老師為我們分享美攝科技的數(shù)字人技術(shù)。

文/張瑞全

編輯/LiveVideoStack

大家好,我是來自美攝科技研發(fā)中心的高級AI算法專家張瑞全。今天分享的主題是美攝科技關(guān)于快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)的整體方案。

-01-

整體概括

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

美攝科技產(chǎn)品主要分為AI數(shù)字人、視音頻處理SDK、AI智能處理、汽車及智能硬件方案、云端/PC端視頻處理方案和開發(fā)及設(shè)計服務(wù)六個部分。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

美攝的技術(shù)已經(jīng)在超過千余款實際產(chǎn)品中落地,尤其針對大量的手機廠商和大型互聯(lián)網(wǎng)客戶,面向多款超千萬級的DAU應(yīng)用,美攝的SDK技術(shù)對大量的硬件和系統(tǒng)進行適配,保障各類場景下兼容性的同時,提供高質(zhì)量的服務(wù)。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

實時語音數(shù)字人是基于語音和文字實時驅(qū)動的高精度數(shù)字人,主要用于數(shù)字客服、車載形象和APP助手等場景中。虛擬主播則更多的應(yīng)用于新聞播報、直播助手和虛擬講解等場景中。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

-02-

數(shù)字人形象生成

數(shù)字人形象的三維渲染是數(shù)字人領(lǐng)域核心內(nèi)容。美攝科技自研的三維圖像渲染技術(shù)擁有強大的渲染能力、多端互通、高效率處理、體積小巧、快速拓展和制作方便六個特點,可以為數(shù)字人制作提供非常強大的輔助作用。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

目前美攝科技支持支持基于物理的材質(zhì)渲染、實時陰影處理、法向量貼圖、全局環(huán)境光和屏幕空間環(huán)境光遮蔽,為各種環(huán)境下的數(shù)字人提供全面且逼真的渲染能力。為了增加可玩性和用途,可以在數(shù)字人身上添加不同的配飾等。目前美攝科技的渲染引擎可以很好地支持輔助道具和數(shù)字人動作的同步,讓數(shù)字形象更加逼真。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

要實現(xiàn)實時語音輸出,就需要數(shù)字人擁有唇音同步能力。美攝科技基于AI訓(xùn)練建立了一套獨特的唇音分析算法,可以實現(xiàn)自然生動的形象展現(xiàn)。通過對輸入的語音進行輕量化AI分析,獲取實際人物的面部表情,再將AI算法輸出的結(jié)果與語音內(nèi)容結(jié)合,驅(qū)動數(shù)字人模型,實現(xiàn)實時的三維唇音同步效果。美攝AI唇音同步技術(shù)具有高效、無時延、過度順滑自然、適配多種語音系統(tǒng)等特點。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

基于自研的Morphing技術(shù),美攝渲染引擎支持多達54種人臉基礎(chǔ)表情。這些基礎(chǔ)表情相互組合,構(gòu)成了擬真的數(shù)字人面部系統(tǒng),幾乎可以囊括所有的人臉表情,為數(shù)字人模型生動的表情展現(xiàn)奠定基礎(chǔ)。左邊5張圖是通過基礎(chǔ)的表情融合出的一些復(fù)雜面部動作。中間是一個實時驅(qū)動的樣例,同時也攜帶了頭發(fā)的物理效果。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

同時我們也提供了非常全面的數(shù)字人設(shè)計工具,設(shè)計師可以將其與C4D、Maya等工具配合,快速進行貼圖更換、效果調(diào)節(jié),實現(xiàn)高效設(shè)計。其中,美攝自研的數(shù)字人設(shè)計工具與渲染器內(nèi)部使用同一套引擎,設(shè)計效果與最終渲染效果完全一致,所見即所得。設(shè)計制作出的模型效果可快速部署發(fā)布。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

這張圖是數(shù)字人的一套基本流程。美攝實時語音數(shù)字人集成了多家合作伙伴的語音系統(tǒng),可以快速理解用戶輸入的文字信息并返回答案,并生成對應(yīng)的數(shù)字人語音,驅(qū)動數(shù)字人進行實時語音播報和動作表達。整套數(shù)字人方案具有良好的開放性和可拓展性,能夠快速與各種主流的AI聊天系統(tǒng)、語音系統(tǒng)進行結(jié)合,形成對應(yīng)的方案。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

一些用戶希望生成的數(shù)字人更加貼合自己的形象,對此我們也提供了形象自動生成的方案。用戶只需提供一張照片,系統(tǒng)將提取特征生成對應(yīng)的數(shù)字人形象。在此基礎(chǔ)上,我們提供人臉屬性檢測+自動形象生成的算法,根據(jù)檢測分析的結(jié)果自動添加配飾,形成用戶專屬的虛擬形象。目前已支持性別、年齡、眼型、發(fā)型等多種人物屬性分析。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

除了自動生成形象外,用戶還可以在生成的形象基礎(chǔ)上修改預(yù)先提供的可修改元素,自定義數(shù)字人形象,滿足個性化需求。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

為應(yīng)對運營成長需求,如本土化適配,節(jié)日、熱點等,美攝科技提供了可自定義的配飾。根據(jù)基礎(chǔ)屬性,通過捏臉換裝可延展出不同的形象。

-03-

AIGC+數(shù)字人

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

虛擬視頻合成技術(shù)是指通過綜合利用計算機視覺、圖像處理和深度學習等技術(shù),實現(xiàn)虛擬視頻的生成,包含語音驅(qū)動、動作驅(qū)動和換臉三個關(guān)鍵技術(shù)。語音驅(qū)動,利用語音去驅(qū)動口型和面部表情,生成講話視頻;動作驅(qū)動,基于源視頻輸入的動作和口型、表情等,驅(qū)動目標視頻人物做出相同的動作、表情和口型;換臉,將目標視頻中的人臉換成某個指定的形象,并且保持目標視頻中人物的動作、表情、口型不變。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

這張圖展示了表情和口型預(yù)測的基本邏輯。使用語音特征提取算法對語音特征進行提取,基于特征進行口型參數(shù)的預(yù)測。隨后根據(jù)口型參數(shù)進行3D面部渲染,并與真實人臉擬合,生成最終的渲染圖。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

特征提取目前常用的算法有兩種,一種是MFCC特征提取,另一種是深度特征提取。目前美攝科技推出了自研的綜合算法和對應(yīng)的特征提取算法。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

口型預(yù)測使用深度學習算法,初步生成當前語音對應(yīng)的口型參數(shù)。為了使幀與幀之間的口型變化更加平滑,我們采用了兩種方法:一種是將一個窗口內(nèi)的預(yù)測結(jié)果做加權(quán)平均,來對預(yù)測的口型進行平滑;另一種是利用LSTM的記憶能力,來平滑預(yù)測口型。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

在講話過程中,當口型發(fā)生變化時人臉的表情和肌肉等都會發(fā)生對應(yīng)的變化。為了使表情更加貼合口型,我們對整個人臉的參數(shù)進行了預(yù)測。基于預(yù)測的人臉參數(shù),通過渲染引擎,對當前人臉進行擬合,渲染得出一套人臉參數(shù)對應(yīng)的人臉表情片。最后基于渲染出的3D人臉表情以及視頻真正對應(yīng)的人臉和mask眼模,利用GAN網(wǎng)絡(luò)完成最終渲染。

考慮到客戶和用戶多樣化的使用場景,美攝科技提供了三種不同的形式,讓大家快速生成自己想要的數(shù)字人形象——照片自動生成形象、視頻自動生成形象以及GLB模型自動生成形象。

圖片生成數(shù)字人形象方案是基于照片快速生成需要的語音播報數(shù)字人。用戶只需要上傳一張人物照,根據(jù)照片和錄入的文本產(chǎn)生對應(yīng)的播報視頻。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

上圖為視頻自動生成數(shù)字人形象方案。用戶可以上傳一段視頻,系統(tǒng)會將視頻中人物的口型替換成想要的口型,同時保持原來視頻中的動作和表情,生成播報形象。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

美攝科技還支持基于傳統(tǒng)3D模型GLB文件快速生成數(shù)字人。GLB文件是以圖形語言傳輸格式保存的3D模型,它以二進制格式存儲有關(guān)3D模型的信息,包括節(jié)點層級、攝像機、材質(zhì)、動畫和網(wǎng)格。以GLB生成數(shù)字人形象時,可以將其轉(zhuǎn)換為美攝自研的3D文件格式“.ARSCENE”,轉(zhuǎn)換后的效果包可以通過美攝SDK在不同的平臺上實時渲染驅(qū)動。

ChatGPT最近非常火,美攝科技也將ChatGPT的混合語義理解能力和美攝已有的語音交互系統(tǒng)相結(jié)合,利用ChatGPT對語義的理解和回答,生成交互式數(shù)字人。用戶只需輸入一段語音或文字,利用ChatGPT對于語音或文字進行理解,對返回的答案進行語音播報。該方案更多用于大屏、車載、APP數(shù)字人等產(chǎn)品中。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

此外,我們還嘗試了將ChatGPT與視頻剪輯和數(shù)字人結(jié)合。用戶只需填寫一句話,設(shè)定好要求,系統(tǒng)就可以通過ChatGPT返回分鏡腳本,并從中提取所需標簽,由系統(tǒng)從媒資庫中智能尋找對應(yīng)的圖像和視頻資料。用戶可以選擇推薦素材,一鍵套用模板,直接形成預(yù)覽視頻,極大提高視頻創(chuàng)作效率。另外我們也提供云剪技術(shù),客戶可以借助云剪對數(shù)字人視頻進行進一步包裝編輯。


LiveVideoStackCon 2023上海講師招募中

LiveVideoStackCon是每個人的舞臺,如果你在團隊、公司中獨當一面,在某一領(lǐng)域或技術(shù)擁有多年實踐,并熱衷于技術(shù)交流,歡迎申請成為LiveVideoStackCon的講師。請?zhí)峤谎葜v內(nèi)容至郵箱:speaker@livevideostack.com。文章來源地址http://www.zghlxwxcb.cn/news/detail-490707.html

到了這里,關(guān)于快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 數(shù)字化新零售營銷模式如何落地?數(shù)字化新零售營銷功能推薦

    數(shù)字化新零售營銷模式如何落地?數(shù)字化新零售營銷功能推薦

    ?通過科技手段,針對對線下零售店面的客戶進行消費行為、頻次等的分析,并進一步整合線上線下資源,實現(xiàn)實體零售的效率充分化,便是目前很火的新零售營銷模式,能夠?qū)嶓w門店與數(shù)字化技術(shù)進行有機結(jié)合,通過為線下門店賦予“線上店”的形式,構(gòu)建了用戶線上線

    2024年02月09日
    瀏覽(36)
  • 落地數(shù)字化管理,提升企業(yè)市場競爭力

    落地數(shù)字化管理,提升企業(yè)市場競爭力

    數(shù)字化企業(yè)管理方案是一種利用數(shù)字技術(shù)和信息系統(tǒng)來提升企業(yè)管理效率和運營效果的策略。 潛在的數(shù)字化企業(yè)管理方案 1、企業(yè)資源規(guī)劃(ERP)系統(tǒng):建立一個集成的ERP系統(tǒng)來統(tǒng)一管理企業(yè)的各項業(yè)務(wù)流程,包括采購、銷售、庫存管理、財務(wù)等。這樣可以提高數(shù)據(jù)的準確性

    2024年02月14日
    瀏覽(21)
  • 融媒行業(yè)落地客戶旅程編排,詳解數(shù)字化用戶運營實戰(zhàn)

    融媒行業(yè)落地客戶旅程編排,詳解數(shù)字化用戶運營實戰(zhàn)

    移動互聯(lián)網(wǎng)時代是流量紅利的時代,企業(yè)常用低成本的方式進行獲客,“增長黑客”的概念大范圍傳播。與此同時,機構(gòu)媒體受到傳播環(huán)境的影響,也開始啟動全行業(yè)的媒體融合轉(zhuǎn)型。在此背景下,2015 年神策數(shù)據(jù)成立,核心解決的是幫助客戶通過數(shù)據(jù)分析實現(xiàn)更好的增長。

    2024年02月12日
    瀏覽(20)
  • 首個零售金融大模型落地,驅(qū)動金融業(yè)數(shù)字化進階

    來源 | 鐳射財經(jīng)(leishecaijing) 在通用大模型+產(chǎn)業(yè)大模型雙模型驅(qū)動下,產(chǎn)業(yè)數(shù)字化向高階智能邁進,為企業(yè)經(jīng)營效率和生產(chǎn)力解放實現(xiàn)質(zhì)的飛躍打開想象空間。作為數(shù)字科技深入滲透的金融業(yè),也有望在大模型浪潮中尋到新的降本解法。 從當前金融業(yè)尤其是零售金融層面來

    2024年02月10日
    瀏覽(29)
  • 數(shù)字化生產(chǎn)車間可視化管理——電子看板

    數(shù)字化生產(chǎn)車間可視化管理——電子看板

    生產(chǎn)效率與企業(yè)發(fā)展息息相關(guān),建立完善的車間生產(chǎn)管理系統(tǒng)是產(chǎn)品生產(chǎn)的重要保障,車間生產(chǎn)看板則是生產(chǎn)車間在精益化管理中執(zhí)行最多的管理應(yīng)用,它對于生產(chǎn)制造企業(yè)有非常重要的意義。大部分企業(yè)通過直接利用生產(chǎn)電子看板來對生產(chǎn)車間的現(xiàn)場進行管理,利用目視化

    2024年02月03日
    瀏覽(25)
  • 數(shù)字化車間mes生產(chǎn)執(zhí)行管理系統(tǒng)

    數(shù)字化車間mes生產(chǎn)執(zhí)行管理系統(tǒng)

    數(shù)字化車間mes是一款基于B/S結(jié)構(gòu)的生產(chǎn)執(zhí)行管理系統(tǒng),主要目的是為中小企業(yè)提供了高效率、低成本、通用性強的一個MES系統(tǒng)解決方案,能夠?qū)崟r監(jiān)控當前完成進度。? 功能簡介: ?? ?生產(chǎn)管理 ?? ?大屏展示:可以從大屏展示頁面看到任工序任務(wù)、在制工單數(shù)、延期工單數(shù)

    2024年02月12日
    瀏覽(99)
  • 數(shù)字化轉(zhuǎn)型具體包含哪些內(nèi)容?

    數(shù)字化轉(zhuǎn)型具體包含哪些內(nèi)容?

    數(shù)字化轉(zhuǎn)型具含構(gòu)建“業(yè)務(wù)數(shù)字化、數(shù)字資產(chǎn)化、資產(chǎn)服務(wù)化、服務(wù)業(yè)務(wù)化”閉環(huán),通過數(shù)字化技術(shù)能力反哺業(yè)務(wù)。所以它并不是做信息化,而是業(yè)務(wù)層面的轉(zhuǎn)型,是一把手工程,數(shù)字化強調(diào)的是人、物理世界、數(shù)字世界的連通與聯(lián)動,在數(shù)字世界構(gòu)建一個第三維數(shù)字空間,

    2024年01月23日
    瀏覽(90)
  • 制造工廠ERP系統(tǒng):從數(shù)字銷售-生產(chǎn)到財務(wù)管理,掌握企業(yè)數(shù)字化十大核心!

    制造工廠ERP系統(tǒng):從數(shù)字銷售-生產(chǎn)到財務(wù)管理,掌握企業(yè)數(shù)字化十大核心!

    在快速發(fā)展的數(shù)字化時代,企業(yè)(尤其是傳統(tǒng)生產(chǎn)制造行業(yè))面臨著諸多挑戰(zhàn)與機遇。無論是客戶體驗、供應(yīng)鏈管理還是內(nèi)部流程優(yōu)化,數(shù)字化都在發(fā)揮著關(guān)鍵作用。為了更好地應(yīng)對數(shù)字化帶來的挑戰(zhàn)和機遇為了更好地應(yīng)對市場變化和提高競爭力,實施數(shù)字化管理已成為企業(yè)

    2024年01月18日
    瀏覽(95)
  • ?數(shù)字化轉(zhuǎn)型升級之工業(yè)元宇宙與AIGC

    ?數(shù)字化轉(zhuǎn)型升級之工業(yè)元宇宙與AIGC

    月説·小飛象·交流會 生活就是,面對復(fù)雜,保持歡喜。心煩時,記住三句話:1、算了吧。2、沒關(guān)系。3、會過去的。 內(nèi)部交流│24期 數(shù)字化轉(zhuǎn)型升級 工業(yè)元宇宙與AIGC data analysis ●●●● 分享人:李鐵軍 ? 現(xiàn)如今數(shù)字化不再是企業(yè)錦上添花的一個工具,而是已經(jīng)成為了企

    2024年02月10日
    瀏覽(24)
  • 車企數(shù)據(jù)治理實踐案例,實現(xiàn)數(shù)據(jù)生產(chǎn)、消費的閉環(huán)鏈路 | 數(shù)字化標桿

    車企數(shù)據(jù)治理實踐案例,實現(xiàn)數(shù)據(jù)生產(chǎn)、消費的閉環(huán)鏈路 | 數(shù)字化標桿

    隨著業(yè)務(wù)飛速發(fā)展,某汽車制造企業(yè)業(yè)務(wù)系統(tǒng)數(shù)量、復(fù)雜度和數(shù)據(jù)量都在呈幾何級數(shù)的上漲,這就對于企業(yè)IT能力和IT架構(gòu)模式的要求越來越高。加之企業(yè)大力發(fā)展數(shù)字化營銷、新能源車等業(yè)務(wù),希望通過持續(xù)優(yōu)化客戶體驗,創(chuàng)造可持續(xù)發(fā)展的數(shù)字化轉(zhuǎn)型之路。 為更好應(yīng)對數(shù)

    2024年02月05日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包