国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

阿里最新EMO:只需要提供一張照片和一段音頻,即可生成會(huì)說話唱歌的AI視頻

這篇具有很好參考價(jià)值的文章主要介紹了阿里最新EMO:只需要提供一張照片和一段音頻,即可生成會(huì)說話唱歌的AI視頻。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

只要一張照片加上音頻,就能讓你說話唱歌,阿里做到了。

最近,阿里新上線了一款A(yù)I圖片-音頻-視頻模型技術(shù)EMO,用戶只需要提供一張照片和一段任意音頻文件,EMO即可生成會(huì)說話唱歌的AI視頻。以及實(shí)現(xiàn)無縫對接的動(dòng)態(tài)小視頻,最長時(shí)間可達(dá)1分30秒左右。

阿里研究團(tuán)隊(duì)表示,EMO可以生成具有表情豐富的面部表情和各種頭部姿勢的聲音頭像視頻,同時(shí),其可以根據(jù)輸入視頻的長度生成任意持續(xù)時(shí)間的視頻。

你可以想象一下,用蒙娜麗莎的畫像就可以生成唱歌的視頻,或者說用一張高啟強(qiáng)的肖像就可以讓強(qiáng)哥變身刑法教授在線授課。還可以讓坤坤變成真正的rapper!值得一提的是,生成的視頻中人物表情非常到位,口型、語速也都能完全匹配。

阿里emo網(wǎng)址,AIGC,深度學(xué)習(xí),論文閱讀,音視頻,人工智能,計(jì)算機(jī)視覺,AGI

阿里EMO:輸入圖片和音頻就可生成視頻,強(qiáng)哥也能上刑法課了!

論文解讀

阿里emo網(wǎng)址,AIGC,深度學(xué)習(xí),論文閱讀,音視頻,人工智能,計(jì)算機(jī)視覺,AGI

github鏈接:https://github.com/HumanAIGC/EMO

論文鏈接:https://github.com/HumanAIGC/EMO

摘要

阿里emo網(wǎng)址,AIGC,深度學(xué)習(xí),論文閱讀,音視頻,人工智能,計(jì)算機(jī)視覺,AGI

????????我們提出了EMO,一個(gè)富有表現(xiàn)力的音頻驅(qū)動(dòng)的人像視頻生成框架。輸入單個(gè)參考圖像和語音音頻,例如說話和唱歌,我們的方法可以生成具有豐富面部表情和各種頭部姿勢的語音化身視頻,同時(shí)我們可以根據(jù)輸入視頻的長度生成任意時(shí)長的視頻。

方法

阿里emo網(wǎng)址,AIGC,深度學(xué)習(xí),論文閱讀,音視頻,人工智能,計(jì)算機(jī)視覺,AGI

提出的方法概述:框架主要由兩個(gè)階段構(gòu)成。在初始階段,稱為幀編碼,使用ReferenceNet從參考圖像和運(yùn)動(dòng)幀中提取特征。隨后,在擴(kuò)散處理階段,預(yù)訓(xùn)練的音頻編碼器處理音頻嵌入。人臉區(qū)域掩模與多幀噪聲相結(jié)合,控制人臉圖像的生成。其次是利用骨干網(wǎng)來簡化去噪操作。在骨干網(wǎng)中,采用了兩種形式的注意機(jī)制:參考注意和聲音注意。這些機(jī)制對于保留角色的身份和調(diào)節(jié)角色的動(dòng)作是必不可少的。另外,利用時(shí)間模塊來控制時(shí)間維度,調(diào)整運(yùn)動(dòng)速度。

????????感謝你看到這里,也歡迎點(diǎn)擊關(guān)注下方公眾號(hào),一個(gè)有趣有AI的AIGC公眾號(hào):關(guān)注AI、深度學(xué)習(xí)、計(jì)算機(jī)視覺、AIGC、Stable Diffusion、Sora等相關(guān)技術(shù),歡迎一起交流學(xué)習(xí)??~文章來源地址http://www.zghlxwxcb.cn/news/detail-840616.html

到了這里,關(guān)于阿里最新EMO:只需要提供一張照片和一段音頻,即可生成會(huì)說話唱歌的AI視頻的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Finalshell連Linux服務(wù)器一直需要密碼,常用方法都試過了還是不行,最后發(fā)現(xiàn)是IP地址錯(cuò)了,要用阿里云提供的IP地址

    Finalshell連Linux服務(wù)器一直需要密碼,常用方法都試過了還是不行,最后發(fā)現(xiàn)是IP地址錯(cuò)了,要用阿里云提供的IP地址

    阿里云買的輕量應(yīng)用服務(wù)器,初次用finalshell連,試過了 1.修改sshd_config文件 2.修改root密碼 3創(chuàng)建新用戶 都沒有成功,最后發(fā)現(xiàn)原來是一個(gè)IP地址有問題,不是用ifconfig獲得的地址,而是在 輕量應(yīng)用服務(wù)器-遠(yuǎn)程連接 中就告訴了SSH客戶端軟件要連的IP地址,用這個(gè)地址就可以了

    2024年02月14日
    瀏覽(26)
  • 通過一張照片來定位拍攝地點(diǎn)和網(wǎng)站的域名 LA CTF 2023

    通過一張照片來定位拍攝地點(diǎn)和網(wǎng)站的域名 LA CTF 2023

    這次打ctf遇到了一個(gè)比較經(jīng)典的osint類題目,在這里分享一下如何做此類題目 題目鏈接: 題目簡介: 你能猜出這個(gè)貓?zhí)焯玫拿謫幔看鸢甘谴宋恢玫木W(wǎng)站域。例如,如果答案是 ucla,則flag將是lactf{ucla.edu} 下載圖片,打開可以看到一群貓貓 照片里的這個(gè)人看起來是白種人,猜

    2023年04月13日
    瀏覽(20)
  • VS2019編譯器修改背景壁紙(寫代碼背景不再單薄,試試換一張清晰的美女照片)

    VS2019編譯器修改背景壁紙(寫代碼背景不再單薄,試試換一張清晰的美女照片)

    第一步:打開vs2019編譯器,在上方菜單欄找到【擴(kuò)展】-【管理擴(kuò)展】-【聯(lián)機(jī)】,在右方搜索欄搜索“claudiaIDE”,找到ClaudiaIDE 2019,點(diǎn)擊下載 第二步:下載完成后,關(guān)閉所有的VS文件,關(guān)閉VS后回到桌面,發(fā)現(xiàn)有一個(gè)“VSIX Installer”的彈窗,選擇“Modify”進(jìn)行安裝,等到修改完

    2023年04月21日
    瀏覽(29)
  • 手機(jī)照片怎么壓縮到200k?思路提供

    手機(jī)照片怎么壓縮到200k?思路提供

    現(xiàn)在的手機(jī)相機(jī)已經(jīng)越來越先進(jìn),照出來的照片也越來越清晰,但是這也帶來了一個(gè)問題,那就是照片占用的存儲(chǔ)空間會(huì)越來越大。有時(shí)候我們需要將照片分享給朋友或上傳到社交媒體上,這時(shí)候需要將照片壓縮,以減小文件大小。下面是一些簡單的方法。 ? 1. 使用手機(jī)自帶

    2024年02月12日
    瀏覽(30)
  • 蘋果手機(jī)照片怎么轉(zhuǎn)換成jpg格式?思路提供

    蘋果手機(jī)照片怎么轉(zhuǎn)換成jpg格式?思路提供

    蘋果手機(jī)的照片默認(rèn)保存為HEIC格式,這種格式可以讓你的照片在占用更少的存儲(chǔ)空間的情況下保持高質(zhì)量。但是,如果你想與其他人分享你的照片,你可能需要將它們轉(zhuǎn)換為JPG格式。以下是將蘋果手機(jī)照片轉(zhuǎn)換為JPG格式的步驟: 首先,打開“設(shè)置”應(yīng)用程序并找到“相機(jī)”

    2024年02月11日
    瀏覽(25)
  • Android framework定制1-->用戶無操作一段時(shí)間,自動(dòng)播放客戶提供的視頻,用戶操作后退出播放

    Android framework定制1-->用戶無操作一段時(shí)間,自動(dòng)播放客戶提供的視頻,用戶操作后退出播放

    在PowerManagerService.java中監(jiān)聽用戶操作,10秒無操作則打開預(yù)置的apk播放視頻,直接上代碼: apk autoplayvideo 的關(guān)鍵代碼: AndroidManifest.xml: activity_main.xml: ? 如果此文章解答了您的相關(guān)疑惑,節(jié)約了您的寶貴時(shí)間,可以Shang小編雞腿喲! ?

    2024年02月02日
    瀏覽(20)
  • 分析Flink,源和算子并行度不一致時(shí),運(yùn)行一段時(shí)間后,看似不再繼續(xù)消費(fèi)的問題,提供解決思路。

    分析Flink,源和算子并行度不一致時(shí),運(yùn)行一段時(shí)間后,看似不再繼續(xù)消費(fèi)的問題,提供解決思路。

    之前有分析過一次類似問題,最終結(jié)論是在keyby之后,其中有一個(gè)key數(shù)量特別龐大,導(dǎo)致對應(yīng)的subtask壓力過大,進(jìn)而使得整個(gè)job不再繼續(xù)運(yùn)作。在這個(gè)問題解決之后,后續(xù)又再次出現(xiàn)了積壓的情況,針對這個(gè)問題進(jìn)行排查分析。 通過以下這張圖,可以看到當(dāng)前它是沒有數(shù)據(jù)積

    2024年02月12日
    瀏覽(17)
  • 阿里云oss對象存儲(chǔ)上傳照片并返回照片路徑

    阿里云oss對象存儲(chǔ)上傳照片并返回照片路徑

    安裝javaJDk 依賴 jdk1.8(只用一個(gè)依賴即可) 使用的是Java 9及以上的版本,則需要添加jaxb相關(guān)依賴。 程序:

    2024年02月13日
    瀏覽(24)
  • java 阿里云上傳照片

    java 阿里云上傳照片

    獲取對象 代碼配置類 yml配置 注意這些參數(shù)都是事先配置好的(也就是注冊阿里云購買過的獲取的參數(shù)) 代碼controller層 代碼service層

    2024年02月07日
    瀏覽(17)
  • Stable Diffusion InstantID 炸裂!只需要一張圖就可以換臉 | 詳細(xì)教程

    Stable Diffusion InstantID 炸裂!只需要一張圖就可以換臉 | 詳細(xì)教程

    最近AI換臉又火起來了, 小紅書 InstantX 團(tuán)隊(duì)發(fā)布了一款最新的換臉技術(shù) InstantID 和之前的主流的訓(xùn)練 lora 換臉不同,InstantID 只需要上傳一張圖就可以實(shí)現(xiàn)換臉以及姿勢替換! InstantID 主要分為了三部分 ID Embedding:通過預(yù)訓(xùn)練的面部識(shí)別模型,將語義人臉特征提取為 Face Embed

    2024年02月20日
    瀏覽(30)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包