国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<rt id="0un6w"><tbody id="0un6w"></tbody></rt><ruby id="0un6w"></ruby>

<style id="0un6w"></style>

<bdo id="0un6w"><acronym id="0un6w"></acronym></bdo><bdo id="0un6w"><tbody id="0un6w"></tbody></bdo>

<ruby id="0un6w"><optgroup id="0un6w"></optgroup></ruby><ruby id="0un6w"></ruby>

一句話生成長視頻

2年前作者：洛克-李分類：Toy博客閱讀(20)違法舉報

這篇具有很好參考價值的文章主要介紹了一句話生成長視頻。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

前段時間，我曾經(jīng)介紹過Imagen Video模型。它能夠在輸入一句話中，生成5~6秒的視頻。而且由于采用了“空間高分辨率模型”和“時域高分辨率模型”的級聯(lián)模型，它能夠清晰度在1280×768的高清視頻。具體的介紹可以回看我之前寫的文章：

短視頻模型Imagen Video：藝術(shù)和3D建模大師

雖然Imagen Video模型，能夠生成高清晰度的短視頻，但是僅僅只有5秒左右的時間，因此實際的用處并不到。為了克服這個缺點，谷歌也進一步發(fā)布了Phenaki模型。

Phenaki

這個模型不同點在于，它能夠根據(jù)200個詞語，生成2分鐘以上的視頻。

比如輸入文字：

一只逼真的泰迪熊正在舊金山的海里游泳
泰迪熊下水了
泰迪熊和五顏六色的魚在水下游泳
一只熊貓在水下游泳

一句話生成長視頻

或者輸入“泰迪熊在海洋中潛水”、“宇航員在火星上跳舞”等詞語，可以生成下面的短視頻：
一句話生成長視頻

同時該模型在修改prompt提示詞語的時候，也能夠生成不一樣的短視頻：
一句話生成長視頻

1.技術(shù)細節(jié)

谷歌新提出的Phenaki，主要是引入了一個新的causal model。這個模型從離散的tokens去壓縮視頻，使得模型能夠克服視頻長度的問題。

如下圖所示，它能夠根據(jù)超長的prompt去生成每一秒的視頻：
一句話生成長視頻

同時分詞器使用了causal attention，這使得它能夠處理可變長度的視頻。為了從文本生成視頻tokens，論文中使用了一個基于預(yù)先計算的文本標(biāo)記的雙向掩碼transformer。

生成的視頻tokens隨后被去標(biāo)記化以創(chuàng)建實際視頻。同時為了解決數(shù)據(jù)問題，論文中使用了大量圖像-文本對語料庫以及少量視頻-文本示例上進行聯(lián)合訓(xùn)練，從而實現(xiàn)超出視頻數(shù)據(jù)集可用范圍的泛化。

先來看一下具體的模型結(jié)構(gòu)
一句話生成長視頻

C-ViViT Encoder：把輸入的視頻構(gòu)造成離散的embedding進行輸出
Traning Transformer：使用了預(yù)訓(xùn)練模型T5X，把embedding翻譯成視頻tokens
Video Generation：把視頻tokens轉(zhuǎn)換成視頻

1.1 Encoder-Decoder架構(gòu)：C-VIVIT

在Phenaki中，由于目標(biāo)是生成可變長度的視頻，同時將視頻tokerns的數(shù)量保持在最小，以便在當(dāng)前的計算限制范圍內(nèi)使用transformer對其進行建模。

因此引入了C-ViViT，這是ViViT的一種casual結(jié)構(gòu)，它可以在時間和空間維度上壓縮視頻，同時保持時間上的自回歸。這種能力允許任意長度生成視頻
一句話生成長視頻

casual attention如上所示。本質(zhì)上就是，每個時間步的tokens僅以自回歸方式觀察來自先前幀的空間標(biāo)記。這樣做的效果是第一幀可以完全獨立地編碼。這為文本到圖像訓(xùn)練自然嵌入到視頻模型中提供了可能性。第二個優(yōu)點是，我們可以根據(jù)起始幀的數(shù)量來調(diào)節(jié)視頻生成過程。

1.2 雙向Transformer

在這個任務(wù)里面，可以把文本到視頻當(dāng)作是一個seq-to-seq的任務(wù)。即可以從文本預(yù)測視頻tokerns。

同時對長視頻進行隨機采樣，這樣可以有效減少預(yù)測的時間步，提高計算效率。
一句話生成長視頻

對于訓(xùn)練來說，從0~1之間隨機選擇一個mask比率，把一定的時間步用[MASK]替換掉，然后在訓(xùn)練的時候則可以預(yù)測這些標(biāo)簽。

從實驗效果上看，可以生成不同風(fēng)格的視頻。
一句話生成長視頻

文本生成視頻所帶來的問題

視頻生成模型可以用來對社會產(chǎn)生積極影響，例如通過放大和增強人類的創(chuàng)造力。然而，這些生成模式也可能被濫用，例如生成虛假、仇恨、明確或有害的內(nèi)容。

同時，新的AI技術(shù)帶來的行業(yè)革新也在悄悄的發(fā)生。比如未來可以利用這些模型合成短視頻，發(fā)布的短視頻平臺上。到時候你看到的視頻，有可能已經(jīng)不是真人視頻了。

好了，本期就到這里了，我是leo，歡迎關(guān)注我的知乎/公眾號“算法一只狗”，我們下期再見~文章來源地址http://www.zghlxwxcb.cn/news/detail-405488.html

到了這里，關(guān)于一句話生成長視頻的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

一句話畫出動漫效果
?鏈接： AI Comic Factory - a Hugging Face Space by jbilcke-hf Discover amazing ML apps made by the community https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory 選擇類型： Japanese ?輸入提示詞：效果如下：
2024年02月10日
瀏覽(25)
你真的了解一句話木馬嗎？
目錄一、前言：二、什么是一句話木馬：三、常見的一句話木馬：木馬講解： 1、$_POST[cmd] 2、eval() 3、\\\"@\\\" 4、脈絡(luò)梳理四、可用于條件競爭的一句話木馬：木馬講解： 1、fopen() 2、fputs() ?3、脈絡(luò)梳理五、圖片馬 1、什么是圖片馬： 2、.htaccess 3、木馬圖片 4.?? .user.ini擴展
2024年02月04日
瀏覽(27)
蟻劍連接一句話木馬演示
需要準(zhǔn)備一臺虛擬機作為服務(wù)器，一臺作為攻擊機（可用主機），將虛擬機的網(wǎng)絡(luò)都設(shè)置為橋接。我這里服務(wù)器用win2008R2系統(tǒng) 攻擊機用win10 接下來我會演示 php 的一句話木馬其他腳本語言的一句話木馬使用過程和這個差別不大在服務(wù)器上安裝phpstudy 快速搭建服務(wù)器安裝成
2024年02月14日
瀏覽(18)
文件上傳漏洞—一句話圖片馬制作
提要：在文件上傳漏洞中，通常需要上傳腳本類型的文件至服務(wù)端執(zhí)行，獲取WebShell，但是網(wǎng)站會嚴格過濾腳本類型的文件，這個時候便可以通過圖片馬來嘗試突破。簡介：在圖片格式文件（JPG，PNG和GIF等）中添加隱藏一句話木馬，利用文件包含漏洞，Web容器解析漏洞和.
2024年02月07日
瀏覽(24)
java安全——jsp一句話木馬
提示：以下是本篇文章正文內(nèi)容，下面案例可供參考 http://localhost:8003/index.jsp?cmd=whoami 不會回顯執(zhí)行的結(jié)果只能在后臺打印一個地址，常用來反彈shell 代碼如下（示例）：
2024年02月11日
瀏覽(16)
滲透干貨｜史上最全一句話木馬
PHP //可執(zhí)行命令一句話普通一句話 PHP系列過狗一句話【----幫助網(wǎng)安學(xué)習(xí)，以下所有學(xué)習(xí)資料文末免費領(lǐng)！----】幾個變性的php–過防火墻過狗效果都不錯：密碼-7 phpv9 高版本拿shell ASP asp 一句話 ASP過安全狗一句話 ASPX系列 ASPX一句話的過安全狗效果不怎么樣不過我認為能
2024年04月25日
瀏覽(22)
一句話解釋什么是出口IP
出口 IP 是指從本地網(wǎng)絡(luò)連接到公共互聯(lián)網(wǎng)時所使用的 IP 地址。這個 IP 地址是由 Internet 服務(wù)提供商（ISP）分配給你的，它可以用來標(biāo)識你的網(wǎng)絡(luò)流量的來源。如果你使用的是 NAT（網(wǎng)絡(luò)地址轉(zhuǎn)換）技術(shù)，則在 NAT 設(shè)備內(nèi)部會進行地址轉(zhuǎn)換，使得多個設(shè)備可以共享同一個公共 I
2024年02月08日
瀏覽(17)
解封ChatGPT我只用了一句話
文章前言 ChatGPT作為一個AI語言模型可以幫助使用者生成各種各樣的文字內(nèi)容，目前已被廣泛應(yīng)用于各種語言任務(wù)中，例如:文本生成、機器翻譯、問答系統(tǒng)等，基于保障使用者權(quán)益和維護良好的價值觀，官方限制ChatGPT不能回答不當(dāng)言論(攻擊或侮辱性)、敏感內(nèi)容和帶有偏見的
2024年02月16日
瀏覽(21)
【AI繪畫】給我一句話，送你一幅畫。
什么是AI繪畫通俗的說，AI繪畫就是AI通過學(xué)習(xí)訓(xùn)練出自己的思考模型，然后繪畫。 AI繪畫優(yōu)劣勢你可以把AI理解為一個天賦非凡的外國繪畫神童優(yōu)勢（效率高）天賦非凡：繪畫的速度非?？?，效率非常高，圖片也很精美不足（理解局限）外國：相對國內(nèi)而言，訓(xùn)練模型
2024年02月09日
瀏覽(24)
AI PPT 一句話搞定PPT講演搞
相信大家在職場中，一定會接觸過寫PPT，經(jīng)常會把你搞得焦頭爛額。在大部分的公司里，寫PPT匯報又是不可能逃避的事情。但隨著AI時代的到來，有很多AI幫你寫PPT的工具也逐漸嶄露頭角，可以自動幫助你制作出華麗的PPT，給你的職場生活帶來極大的便利。這些AI寫PPT工具可以
2024年02月13日
瀏覽(27)

<rt id="ieuwf"></rt>