国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

一句話生成長視頻

這篇具有很好參考價值的文章主要介紹了一句話生成長視頻。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

前段時間,我曾經(jīng)介紹過Imagen Video模型。它能夠在輸入一句話中,生成5~6秒的視頻。而且由于采用了“空間高分辨率模型”和“時域高分辨率模型”的級聯(lián)模型,它能夠清晰度在1280×768的高清視頻。具體的介紹可以回看我之前寫的文章:

短視頻模型Imagen Video:藝術(shù)和3D建模大師

雖然Imagen Video模型,能夠生成高清晰度的短視頻,但是僅僅只有5秒左右的時間,因此實際的用處并不到。為了克服這個缺點,谷歌也進一步發(fā)布了Phenaki模型。

Phenaki

這個模型不同點在于,它能夠根據(jù)200個詞語,生成2分鐘以上的視頻。

比如輸入文字:

一只逼真的泰迪熊正在舊金山的海里游泳
泰迪熊下水了
泰迪熊和五顏六色的魚在水下游泳
一只熊貓在水下游泳

一句話生成長視頻

或者輸入“泰迪熊在海洋中潛水”、“宇航員在火星上跳舞”等詞語,可以生成下面的短視頻:
一句話生成長視頻

同時該模型在修改prompt提示詞語的時候,也能夠生成不一樣的短視頻:
一句話生成長視頻

1.技術(shù)細節(jié)

谷歌新提出的Phenaki,主要是引入了一個新的causal model。這個模型從離散的tokens去壓縮視頻,使得模型能夠克服視頻長度的問題。

如下圖所示,它能夠根據(jù)超長的prompt去生成每一秒的視頻:
一句話生成長視頻

同時分詞器使用了causal attention,這使得它能夠處理可變長度的視頻。為了從文本生成視頻tokens,論文中使用了一個基于預(yù)先計算的文本標(biāo)記的雙向掩碼transformer。

生成的視頻tokens隨后被去標(biāo)記化以創(chuàng)建實際視頻。同時為了解決數(shù)據(jù)問題,論文中使用了大量圖像-文本對語料庫以及少量視頻-文本示例上進行聯(lián)合訓(xùn)練,從而實現(xiàn)超出視頻數(shù)據(jù)集可用范圍的泛化。

先來看一下具體的模型結(jié)構(gòu)
一句話生成長視頻

  • C-ViViT Encoder:把輸入的視頻構(gòu)造成離散的embedding進行輸出
  • Traning Transformer:使用了預(yù)訓(xùn)練模型T5X,把embedding翻譯成視頻tokens
  • Video Generation:把視頻tokens轉(zhuǎn)換成視頻

1.1 Encoder-Decoder架構(gòu):C-VIVIT

在Phenaki中,由于目標(biāo)是生成可變長度的視頻,同時將視頻tokerns的數(shù)量保持在最小,以便在當(dāng)前的計算限制范圍內(nèi)使用transformer對其進行建模。

因此引入了C-ViViT,這是ViViT的一種casual結(jié)構(gòu),它可以在時間和空間維度上壓縮視頻,同時保持時間上的自回歸。這種能力允許任意長度生成視頻
一句話生成長視頻

casual attention如上所示。本質(zhì)上就是,每個時間步的tokens僅以自回歸方式觀察來自先前幀的空間標(biāo)記。這樣做的效果是第一幀可以完全獨立地編碼。這為文本到圖像訓(xùn)練自然嵌入到視頻模型中提供了可能性。第二個優(yōu)點是,我們可以根據(jù)起始幀的數(shù)量來調(diào)節(jié)視頻生成過程。

1.2 雙向Transformer

在這個任務(wù)里面,可以把文本到視頻當(dāng)作是一個seq-to-seq的任務(wù)。即可以從文本預(yù)測視頻tokerns。

同時對長視頻進行隨機采樣,這樣可以有效減少預(yù)測的時間步,提高計算效率。
一句話生成長視頻

對于訓(xùn)練來說,從0~1之間隨機選擇一個mask比率,把一定的時間步用[MASK]替換掉,然后在訓(xùn)練的時候則可以預(yù)測這些標(biāo)簽。

從實驗效果上看,可以生成不同風(fēng)格的視頻。
一句話生成長視頻

文本生成視頻所帶來的問題

視頻生成模型可以用來對社會產(chǎn)生積極影響,例如通過放大和增強人類的創(chuàng)造力。然而,這些生成模式也可能被濫用,例如生成虛假、仇恨、明確或有害的內(nèi)容。

同時,新的AI技術(shù)帶來的行業(yè)革新也在悄悄的發(fā)生。比如未來可以利用這些模型合成短視頻,發(fā)布的短視頻平臺上。到時候你看到的視頻,有可能已經(jīng)不是真人視頻了。

好了,本期就到這里了,我是leo,歡迎關(guān)注我的知乎/公眾號“算法一只狗”,我們下期再見~文章來源地址http://www.zghlxwxcb.cn/news/detail-405488.html

到了這里,關(guān)于一句話生成長視頻的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 一句話畫出動漫效果

    一句話畫出動漫效果

    ?鏈接: AI Comic Factory - a Hugging Face Space by jbilcke-hf Discover amazing ML apps made by the community https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory 選擇類型: Japanese ?輸入提示詞: 效果如下:

    2024年02月10日
    瀏覽(25)
  • 你真的了解一句話木馬嗎?

    你真的了解一句話木馬嗎?

    目錄 一、前言: 二、什么是一句話木馬: 三、常見的一句話木馬: 木馬講解: 1、$_POST[cmd] 2、eval() 3、\\\"@\\\" 4、脈絡(luò)梳理 四、可用于條件競爭的一句話木馬: 木馬講解: 1、fopen() 2、fputs() ?3、脈絡(luò)梳理 五、圖片馬 1、什么是圖片馬: 2、.htaccess 3、木馬圖片 4.?? .user.ini擴展

    2024年02月04日
    瀏覽(27)
  • 蟻劍連接一句話木馬演示

    蟻劍連接一句話木馬演示

    需要準(zhǔn)備 一臺虛擬機作為服務(wù)器,一臺作為攻擊機(可用主機),將虛擬機的網(wǎng)絡(luò)都設(shè)置為橋接。 我這里服務(wù)器用win2008R2系統(tǒng) 攻擊機用win10 接下來我會演示 php 的一句話木馬 其他腳本語言的一句話木馬使用過程和這個差別不大 在服務(wù)器上安裝phpstudy 快速搭建服務(wù)器 安裝成

    2024年02月14日
    瀏覽(18)
  • 文件上傳漏洞—一句話圖片馬制作

    文件上傳漏洞—一句話圖片馬制作

    提要 :在文件上傳漏洞中,通常需要上傳腳本類型的文件至服務(wù)端執(zhí)行,獲取WebShell,但是網(wǎng)站會嚴格過濾腳本類型的文件,這個時候便可以通過圖片馬來嘗試突破。 簡介 :在圖片格式文件(JPG,PNG和GIF等)中添加隱藏一句話木馬,利用文件包含漏洞,Web容器解析漏洞和.

    2024年02月07日
    瀏覽(24)
  • java安全——jsp一句話木馬

    java安全——jsp一句話木馬

    提示:以下是本篇文章正文內(nèi)容,下面案例可供參考 http://localhost:8003/index.jsp?cmd=whoami 不會回顯執(zhí)行的結(jié)果只能在后臺打印一個地址,常用來反彈shell 代碼如下(示例):

    2024年02月11日
    瀏覽(16)
  • 滲透干貨|史上最全一句話木馬

    滲透干貨|史上最全一句話木馬

    PHP //可執(zhí)行命令一句話 普通一句話 PHP系列 過狗一句話 【----幫助網(wǎng)安學(xué)習(xí),以下所有學(xué)習(xí)資料文末免費領(lǐng)!----】 幾個變性的php–過防火墻 過狗效果都不錯: 密碼-7 phpv9 高版本拿shell ASP asp 一句話 ASP過安全狗一句話 ASPX系列 ASPX一句話的 過安全狗效果不怎么樣 不過我認為能

    2024年04月25日
    瀏覽(22)
  • 一句話解釋什么是出口IP

    一句話解釋什么是出口IP

    出口 IP 是指從本地網(wǎng)絡(luò)連接到公共互聯(lián)網(wǎng)時所使用的 IP 地址。這個 IP 地址是由 Internet 服務(wù)提供商(ISP)分配給你的,它可以用來標(biāo)識你的網(wǎng)絡(luò)流量的來源。如果你使用的是 NAT(網(wǎng)絡(luò)地址轉(zhuǎn)換)技術(shù),則在 NAT 設(shè)備內(nèi)部會進行地址轉(zhuǎn)換,使得多個設(shè)備可以共享同一個公共 I

    2024年02月08日
    瀏覽(17)
  • 解封ChatGPT我只用了一句話

    解封ChatGPT我只用了一句話

    文章前言 ChatGPT作為一個AI語言模型可以幫助使用者生成各種各樣的文字內(nèi)容,目前已被廣泛應(yīng)用于各種語言任務(wù)中,例如:文本生成、機器翻譯、問答系統(tǒng)等,基于保障使用者權(quán)益和維護良好的價值觀,官方限制ChatGPT不能回答不當(dāng)言論(攻擊或侮辱性)、敏感內(nèi)容和帶有偏見的

    2024年02月16日
    瀏覽(21)
  • 【AI繪畫】給我一句話,送你一幅畫。

    【AI繪畫】給我一句話,送你一幅畫。

    什么是AI繪畫 通俗的說,AI繪畫就是AI通過學(xué)習(xí)訓(xùn)練出自己的思考模型,然后繪畫。 AI繪畫優(yōu)劣勢 你可以把AI理解為一個天賦非凡的外國繪畫神童 優(yōu)勢 (效率高) 天賦非凡 :繪畫的速度非???,效率非常高,圖片也很精美 不足 (理解局限) 外國 :相對國內(nèi)而言,訓(xùn)練模型

    2024年02月09日
    瀏覽(24)
  • AI PPT 一句話搞定PPT講演搞

    AI PPT 一句話搞定PPT講演搞

    相信大家在職場中,一定會接觸過寫PPT,經(jīng)常會把你搞得焦頭爛額。在大部分的公司里,寫PPT匯報又是不可能逃避的事情。但隨著AI時代的到來,有很多AI幫你寫PPT的工具也逐漸嶄露頭角,可以自動幫助你制作出華麗的PPT,給你的職場生活帶來極大的便利。這些AI寫PPT工具可以

    2024年02月13日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包