国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<ul id="e1es9"></ul>

<delect id="e1es9"><strong id="e1es9"></strong></delect>

<u id="e1es9"><samp id="e1es9"></samp></u>

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

2年前作者：LiveVideoStack_分類：Toy博客閱讀(27)違法舉報

這篇具有很好參考價值的文章主要介紹了快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

誰不想有一個可愛的數(shù)字人形象呢？在日常的工作和娛樂中，越來越多的數(shù)字人虛擬形象與大家見面，他們可以是主播，也可以是語音助手，還可以是你自己的虛擬寵物。只有更快更精準的生成數(shù)字人，才能讓數(shù)字人更加普及，普通消費者才能更多地接觸到數(shù)字人。LiveVideoStackCon 2022北京站邀請到了張瑞全老師為我們分享美攝科技的數(shù)字人技術(shù)。

文/張瑞全

編輯/LiveVideoStack

大家好，我是來自美攝科技研發(fā)中心的高級AI算法專家張瑞全。今天分享的主題是美攝科技關(guān)于快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)的整體方案。

-01-

整體概括

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

美攝科技產(chǎn)品主要分為AI數(shù)字人、視音頻處理SDK、AI智能處理、汽車及智能硬件方案、云端/PC端視頻處理方案和開發(fā)及設(shè)計服務(wù)六個部分。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

美攝的技術(shù)已經(jīng)在超過千余款實際產(chǎn)品中落地，尤其針對大量的手機廠商和大型互聯(lián)網(wǎng)客戶，面向多款超千萬級的DAU應(yīng)用，美攝的SDK技術(shù)對大量的硬件和系統(tǒng)進行適配，保障各類場景下兼容性的同時，提供高質(zhì)量的服務(wù)。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

實時語音數(shù)字人是基于語音和文字實時驅(qū)動的高精度數(shù)字人，主要用于數(shù)字客服、車載形象和APP助手等場景中。虛擬主播則更多的應(yīng)用于新聞播報、直播助手和虛擬講解等場景中。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

-02-

數(shù)字人形象生成

數(shù)字人形象的三維渲染是數(shù)字人領(lǐng)域核心內(nèi)容。美攝科技自研的三維圖像渲染技術(shù)擁有強大的渲染能力、多端互通、高效率處理、體積小巧、快速拓展和制作方便六個特點，可以為數(shù)字人制作提供非常強大的輔助作用。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

目前美攝科技支持支持基于物理的材質(zhì)渲染、實時陰影處理、法向量貼圖、全局環(huán)境光和屏幕空間環(huán)境光遮蔽，為各種環(huán)境下的數(shù)字人提供全面且逼真的渲染能力。為了增加可玩性和用途，可以在數(shù)字人身上添加不同的配飾等。目前美攝科技的渲染引擎可以很好地支持輔助道具和數(shù)字人動作的同步，讓數(shù)字形象更加逼真。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

要實現(xiàn)實時語音輸出，就需要數(shù)字人擁有唇音同步能力。美攝科技基于AI訓(xùn)練建立了一套獨特的唇音分析算法，可以實現(xiàn)自然生動的形象展現(xiàn)。通過對輸入的語音進行輕量化AI分析，獲取實際人物的面部表情，再將AI算法輸出的結(jié)果與語音內(nèi)容結(jié)合，驅(qū)動數(shù)字人模型，實現(xiàn)實時的三維唇音同步效果。美攝AI唇音同步技術(shù)具有高效、無時延、過度順滑自然、適配多種語音系統(tǒng)等特點。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

基于自研的Morphing技術(shù)，美攝渲染引擎支持多達54種人臉基礎(chǔ)表情。這些基礎(chǔ)表情相互組合，構(gòu)成了擬真的數(shù)字人面部系統(tǒng)，幾乎可以囊括所有的人臉表情，為數(shù)字人模型生動的表情展現(xiàn)奠定基礎(chǔ)。左邊5張圖是通過基礎(chǔ)的表情融合出的一些復(fù)雜面部動作。中間是一個實時驅(qū)動的樣例，同時也攜帶了頭發(fā)的物理效果。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

同時我們也提供了非常全面的數(shù)字人設(shè)計工具，設(shè)計師可以將其與C4D、Maya等工具配合，快速進行貼圖更換、效果調(diào)節(jié)，實現(xiàn)高效設(shè)計。其中，美攝自研的數(shù)字人設(shè)計工具與渲染器內(nèi)部使用同一套引擎，設(shè)計效果與最終渲染效果完全一致，所見即所得。設(shè)計制作出的模型效果可快速部署發(fā)布。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

這張圖是數(shù)字人的一套基本流程。美攝實時語音數(shù)字人集成了多家合作伙伴的語音系統(tǒng)，可以快速理解用戶輸入的文字信息并返回答案，并生成對應(yīng)的數(shù)字人語音，驅(qū)動數(shù)字人進行實時語音播報和動作表達。整套數(shù)字人方案具有良好的開放性和可拓展性，能夠快速與各種主流的AI聊天系統(tǒng)、語音系統(tǒng)進行結(jié)合，形成對應(yīng)的方案。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

一些用戶希望生成的數(shù)字人更加貼合自己的形象，對此我們也提供了形象自動生成的方案。用戶只需提供一張照片，系統(tǒng)將提取特征生成對應(yīng)的數(shù)字人形象。在此基礎(chǔ)上，我們提供人臉屬性檢測+自動形象生成的算法，根據(jù)檢測分析的結(jié)果自動添加配飾，形成用戶專屬的虛擬形象。目前已支持性別、年齡、眼型、發(fā)型等多種人物屬性分析。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

除了自動生成形象外，用戶還可以在生成的形象基礎(chǔ)上修改預(yù)先提供的可修改元素，自定義數(shù)字人形象，滿足個性化需求。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

為應(yīng)對運營成長需求，如本土化適配，節(jié)日、熱點等，美攝科技提供了可自定義的配飾。根據(jù)基礎(chǔ)屬性，通過捏臉換裝可延展出不同的形象。

-03-

AIGC+數(shù)字人

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

虛擬視頻合成技術(shù)是指通過綜合利用計算機視覺、圖像處理和深度學習等技術(shù)，實現(xiàn)虛擬視頻的生成，包含語音驅(qū)動、動作驅(qū)動和換臉三個關(guān)鍵技術(shù)。語音驅(qū)動，利用語音去驅(qū)動口型和面部表情，生成講話視頻；動作驅(qū)動，基于源視頻輸入的動作和口型、表情等，驅(qū)動目標視頻人物做出相同的動作、表情和口型；換臉，將目標視頻中的人臉換成某個指定的形象，并且保持目標視頻中人物的動作、表情、口型不變。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

這張圖展示了表情和口型預(yù)測的基本邏輯。使用語音特征提取算法對語音特征進行提取，基于特征進行口型參數(shù)的預(yù)測。隨后根據(jù)口型參數(shù)進行3D面部渲染，并與真實人臉擬合，生成最終的渲染圖。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

特征提取目前常用的算法有兩種，一種是MFCC特征提取，另一種是深度特征提取。目前美攝科技推出了自研的綜合算法和對應(yīng)的特征提取算法。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

口型預(yù)測使用深度學習算法，初步生成當前語音對應(yīng)的口型參數(shù)。為了使幀與幀之間的口型變化更加平滑，我們采用了兩種方法：一種是將一個窗口內(nèi)的預(yù)測結(jié)果做加權(quán)平均，來對預(yù)測的口型進行平滑；另一種是利用LSTM的記憶能力，來平滑預(yù)測口型。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

在講話過程中，當口型發(fā)生變化時人臉的表情和肌肉等都會發(fā)生對應(yīng)的變化。為了使表情更加貼合口型，我們對整個人臉的參數(shù)進行了預(yù)測。基于預(yù)測的人臉參數(shù)，通過渲染引擎，對當前人臉進行擬合，渲染得出一套人臉參數(shù)對應(yīng)的人臉表情片。最后基于渲染出的3D人臉表情以及視頻真正對應(yīng)的人臉和mask眼模，利用GAN網(wǎng)絡(luò)完成最終渲染。

考慮到客戶和用戶多樣化的使用場景，美攝科技提供了三種不同的形式，讓大家快速生成自己想要的數(shù)字人形象——照片自動生成形象、視頻自動生成形象以及GLB模型自動生成形象。

圖片生成數(shù)字人形象方案是基于照片快速生成需要的語音播報數(shù)字人。用戶只需要上傳一張人物照，根據(jù)照片和錄入的文本產(chǎn)生對應(yīng)的播報視頻。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

上圖為視頻自動生成數(shù)字人形象方案。用戶可以上傳一段視頻，系統(tǒng)會將視頻中人物的口型替換成想要的口型，同時保持原來視頻中的動作和表情，生成播報形象。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

美攝科技還支持基于傳統(tǒng)3D模型GLB文件快速生成數(shù)字人。GLB文件是以圖形語言傳輸格式保存的3D模型，它以二進制格式存儲有關(guān)3D模型的信息，包括節(jié)點層級、攝像機、材質(zhì)、動畫和網(wǎng)格。以GLB生成數(shù)字人形象時，可以將其轉(zhuǎn)換為美攝自研的3D文件格式“.ARSCENE”，轉(zhuǎn)換后的效果包可以通過美攝SDK在不同的平臺上實時渲染驅(qū)動。

ChatGPT最近非常火，美攝科技也將ChatGPT的混合語義理解能力和美攝已有的語音交互系統(tǒng)相結(jié)合，利用ChatGPT對語義的理解和回答，生成交互式數(shù)字人。用戶只需輸入一段語音或文字，利用ChatGPT對于語音或文字進行理解，對返回的答案進行語音播報。該方案更多用于大屏、車載、APP數(shù)字人等產(chǎn)品中。

快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)

此外，我們還嘗試了將ChatGPT與視頻剪輯和數(shù)字人結(jié)合。用戶只需填寫一句話，設(shè)定好要求，系統(tǒng)就可以通過ChatGPT返回分鏡腳本，并從中提取所需標簽，由系統(tǒng)從媒資庫中智能尋找對應(yīng)的圖像和視頻資料。用戶可以選擇推薦素材，一鍵套用模板，直接形成預(yù)覽視頻，極大提高視頻創(chuàng)作效率。另外我們也提供云剪技術(shù)，客戶可以借助云剪對數(shù)字人視頻進行進一步包裝編輯。

LiveVideoStackCon 2023上海講師招募中

LiveVideoStackCon是每個人的舞臺，如果你在團隊、公司中獨當一面，在某一領(lǐng)域或技術(shù)擁有多年實踐，并熱衷于技術(shù)交流，歡迎申請成為LiveVideoStackCon的講師。請?zhí)峤谎葜v內(nèi)容至郵箱：speaker@livevideostack.com。文章來源地址http://www.zghlxwxcb.cn/news/detail-490707.html

到了這里，關(guān)于快速落地基于“AIGC+數(shù)字人”的數(shù)字化內(nèi)容生產(chǎn)的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

數(shù)字化新零售營銷模式如何落地？數(shù)字化新零售營銷功能推薦
?通過科技手段，針對對線下零售店面的客戶進行消費行為、頻次等的分析，并進一步整合線上線下資源，實現(xiàn)實體零售的效率充分化，便是目前很火的新零售營銷模式，能夠?qū)嶓w門店與數(shù)字化技術(shù)進行有機結(jié)合，通過為線下門店賦予“線上店”的形式，構(gòu)建了用戶線上線
2024年02月09日
瀏覽(36)
落地數(shù)字化管理，提升企業(yè)市場競爭力
數(shù)字化企業(yè)管理方案是一種利用數(shù)字技術(shù)和信息系統(tǒng)來提升企業(yè)管理效率和運營效果的策略。潛在的數(shù)字化企業(yè)管理方案 1、企業(yè)資源規(guī)劃（ERP）系統(tǒng)：建立一個集成的ERP系統(tǒng)來統(tǒng)一管理企業(yè)的各項業(yè)務(wù)流程，包括采購、銷售、庫存管理、財務(wù)等。這樣可以提高數(shù)據(jù)的準確性
2024年02月14日
瀏覽(21)
融媒行業(yè)落地客戶旅程編排，詳解數(shù)字化用戶運營實戰(zhàn)
移動互聯(lián)網(wǎng)時代是流量紅利的時代，企業(yè)常用低成本的方式進行獲客，“增長黑客”的概念大范圍傳播。與此同時，機構(gòu)媒體受到傳播環(huán)境的影響，也開始啟動全行業(yè)的媒體融合轉(zhuǎn)型。在此背景下，2015 年神策數(shù)據(jù)成立，核心解決的是幫助客戶通過數(shù)據(jù)分析實現(xiàn)更好的增長。
2024年02月12日
瀏覽(20)
首個零售金融大模型落地，驅(qū)動金融業(yè)數(shù)字化進階
來源 | 鐳射財經(jīng)（leishecaijing）在通用大模型+產(chǎn)業(yè)大模型雙模型驅(qū)動下，產(chǎn)業(yè)數(shù)字化向高階智能邁進，為企業(yè)經(jīng)營效率和生產(chǎn)力解放實現(xiàn)質(zhì)的飛躍打開想象空間。作為數(shù)字科技深入滲透的金融業(yè)，也有望在大模型浪潮中尋到新的降本解法。從當前金融業(yè)尤其是零售金融層面來
2024年02月10日
瀏覽(29)
數(shù)字化生產(chǎn)車間可視化管理——電子看板
生產(chǎn)效率與企業(yè)發(fā)展息息相關(guān)，建立完善的車間生產(chǎn)管理系統(tǒng)是產(chǎn)品生產(chǎn)的重要保障，車間生產(chǎn)看板則是生產(chǎn)車間在精益化管理中執(zhí)行最多的管理應(yīng)用，它對于生產(chǎn)制造企業(yè)有非常重要的意義。大部分企業(yè)通過直接利用生產(chǎn)電子看板來對生產(chǎn)車間的現(xiàn)場進行管理，利用目視化
2024年02月03日
瀏覽(25)
數(shù)字化車間mes生產(chǎn)執(zhí)行管理系統(tǒng)
數(shù)字化車間mes是一款基于B/S結(jié)構(gòu)的生產(chǎn)執(zhí)行管理系統(tǒng)，主要目的是為中小企業(yè)提供了高效率、低成本、通用性強的一個MES系統(tǒng)解決方案，能夠?qū)崟r監(jiān)控當前完成進度。? 功能簡介： ?? ?生產(chǎn)管理 ?? ?大屏展示：可以從大屏展示頁面看到任工序任務(wù)、在制工單數(shù)、延期工單數(shù)
2024年02月12日
瀏覽(99)
數(shù)字化轉(zhuǎn)型具體包含哪些內(nèi)容？
數(shù)字化轉(zhuǎn)型具含構(gòu)建“業(yè)務(wù)數(shù)字化、數(shù)字資產(chǎn)化、資產(chǎn)服務(wù)化、服務(wù)業(yè)務(wù)化”閉環(huán)，通過數(shù)字化技術(shù)能力反哺業(yè)務(wù)。所以它并不是做信息化，而是業(yè)務(wù)層面的轉(zhuǎn)型，是一把手工程，數(shù)字化強調(diào)的是人、物理世界、數(shù)字世界的連通與聯(lián)動，在數(shù)字世界構(gòu)建一個第三維數(shù)字空間，
2024年01月23日
瀏覽(90)
制造工廠ERP系統(tǒng)：從數(shù)字銷售-生產(chǎn)到財務(wù)管理，掌握企業(yè)數(shù)字化十大核心！
在快速發(fā)展的數(shù)字化時代，企業(yè)（尤其是傳統(tǒng)生產(chǎn)制造行業(yè)）面臨著諸多挑戰(zhàn)與機遇。無論是客戶體驗、供應(yīng)鏈管理還是內(nèi)部流程優(yōu)化，數(shù)字化都在發(fā)揮著關(guān)鍵作用。為了更好地應(yīng)對數(shù)字化帶來的挑戰(zhàn)和機遇為了更好地應(yīng)對市場變化和提高競爭力，實施數(shù)字化管理已成為企業(yè)
2024年01月18日
瀏覽(95)
?數(shù)字化轉(zhuǎn)型升級之工業(yè)元宇宙與AIGC
月説·小飛象·交流會生活就是，面對復(fù)雜，保持歡喜。心煩時，記住三句話：1、算了吧。2、沒關(guān)系。3、會過去的。內(nèi)部交流│24期數(shù)字化轉(zhuǎn)型升級工業(yè)元宇宙與AIGC data analysis ●●●● 分享人：李鐵軍 ? 現(xiàn)如今數(shù)字化不再是企業(yè)錦上添花的一個工具，而是已經(jīng)成為了企
2024年02月10日
瀏覽(24)
車企數(shù)據(jù)治理實踐案例，實現(xiàn)數(shù)據(jù)生產(chǎn)、消費的閉環(huán)鏈路 | 數(shù)字化標桿
隨著業(yè)務(wù)飛速發(fā)展，某汽車制造企業(yè)業(yè)務(wù)系統(tǒng)數(shù)量、復(fù)雜度和數(shù)據(jù)量都在呈幾何級數(shù)的上漲，這就對于企業(yè)IT能力和IT架構(gòu)模式的要求越來越高。加之企業(yè)大力發(fā)展數(shù)字化營銷、新能源車等業(yè)務(wù)，希望通過持續(xù)優(yōu)化客戶體驗，創(chuàng)造可持續(xù)發(fā)展的數(shù)字化轉(zhuǎn)型之路。為更好應(yīng)對數(shù)
2024年02月05日
瀏覽(23)