国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

文生圖——DALL-E 3 —論文解讀——第一版

這篇具有很好參考價值的文章主要介紹了文生圖——DALL-E 3 —論文解讀——第一版。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

概述

?? ?本文主要是DALL·E 3官方第一版技術(shù)報告(論文)的解讀,原文《Improving Image Generation with Better Captions》論文解讀。該文要提升文生圖的效果,將技術(shù)點(diǎn)放到了,提升指令跟隨能力上,然后順藤摸瓜分為提升訓(xùn)練數(shù)據(jù)caption(使用模型合成caption),當(dāng)然也要提升模型(關(guān)于模型結(jié)構(gòu)、訓(xùn)練策略、數(shù)據(jù)集等都未做過多介紹,但是官方又明確提到,除了數(shù)據(jù),模型也起到了不少的作用)。
? ? 一句話省流版,數(shù)據(jù)方面,訓(xùn)練時使用95%模型(CoCa)合成詳細(xì)描述caption + 5%原本人類 caption,測試時使用GPT-4v 擴(kuò)寫人類caption;模型方面使用T5xxl + vae encoder + diffusion latent + 自家decoder 取得最好效果。

效果

? ? 參考幾個之前公眾號推出的測試效果:
?? ? DALL·E 3內(nèi)部實(shí)測效果驚人!Karpathy生成逼真靈動「美國小姐」,50個物體一圖全包
?? ?

文章來源地址http://www.zghlxwxcb.cn/news/detail-720539.html

到了這里,關(guān)于文生圖——DALL-E 3 —論文解讀——第一版的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • AIGC之論文筆記DALL-E

    AIGC之論文筆記DALL-E

    機(jī)構(gòu):openai 代碼:https://github.com/openai/DALL-E 人們常說自然語言處理是人工智能皇冠上的明珠,這些年transformer以及大規(guī)模語言模型LLM的蓬勃發(fā)展,讓這顆明珠更加熠熠生輝。除此之外,ViT,MAE等方法也充分驗(yàn)證了圖像在transformer以及大規(guī)模預(yù)訓(xùn)練之路上的可行性,那么近一步

    2024年01月25日
    瀏覽(22)
  • 最新AIGC創(chuàng)作系統(tǒng)ChatGPT系統(tǒng)源碼,支持最新GPT-4-Turbo模型,支持DALL-E3文生圖,圖片對話理解功能

    最新AIGC創(chuàng)作系統(tǒng)ChatGPT系統(tǒng)源碼,支持最新GPT-4-Turbo模型,支持DALL-E3文生圖,圖片對話理解功能

    SparkAi創(chuàng)作系統(tǒng)是基于OpenAI很火的ChatGPT進(jìn)行開發(fā)的Ai智能問答系統(tǒng)和Midjourney繪畫系統(tǒng),支持OpenAI-GPT全模型+國內(nèi)AI全模型。本期針對源碼系統(tǒng)整體測試下來非常完美,可以說SparkAi是目前國內(nèi)一款的ChatGPT對接OpenAI軟件系統(tǒng)。那么如何搭建部署AI創(chuàng)作ChatGPT?小編這里寫一個詳細(xì)圖

    2024年02月04日
    瀏覽(28)
  • DALL-E2原理解讀——大模型論文閱讀筆記五

    DALL-E2原理解讀——大模型論文閱讀筆記五

    論文:https://cdn.openai.com/papers/dall-e-2.pdf 項(xiàng)目:https://openai.com/dall-e-2 利用CLIP提取的文本特征,級聯(lián)式的生成圖片。第一階段通過prior將文本特征與圖像特征進(jìn)行對齊,第二階段用擴(kuò)散模型將視覺特征轉(zhuǎn)化為生成圖片。整體來看,DALL-E2就是CLIP與擴(kuò)散模型的結(jié)合,因此作者也將其

    2024年02月11日
    瀏覽(21)
  • 最新國內(nèi)可用GPT4、Midjourney繪畫、DALL-E3文生圖模型教程

    最新國內(nèi)可用GPT4、Midjourney繪畫、DALL-E3文生圖模型教程

    ChatGPT3.5、GPT4.0、GPT語音對話、Midjourney繪畫,文檔對話總結(jié)+DALL-E3文生圖,相信對大家應(yīng)該不感到陌生吧?簡單來說,GPT-4技術(shù)比之前的GPT-3.5相對來說更加智能,會根據(jù)用戶的要求生成多種內(nèi)容甚至也可以和用戶進(jìn)行創(chuàng)作交流。 然而,GPT-4對普通用戶來說都是需要額外付費(fèi)才可

    2024年01月20日
    瀏覽(39)
  • AI創(chuàng)作系統(tǒng)ChatGPT源碼+AI繪畫系統(tǒng)+支持OpenAI DALL-E3文生圖,可直接對話文生圖

    AI創(chuàng)作系統(tǒng)ChatGPT源碼+AI繪畫系統(tǒng)+支持OpenAI DALL-E3文生圖,可直接對話文生圖

    SparkAi創(chuàng)作系統(tǒng)是基于OpenAI很火的ChatGPT進(jìn)行開發(fā)的Ai智能問答系統(tǒng)和Midjourney繪畫系統(tǒng),支持OpenAI-GPT全模型+國內(nèi)AI全模型。本期針對源碼系統(tǒng)整體測試下來非常完美,可以說SparkAi是目前國內(nèi)一款的ChatGPT對接OpenAI軟件系統(tǒng)。新增支持最新GPT-4多模態(tài)模型、OpenAI GPT-4-Turbo-With-Visio

    2024年01月17日
    瀏覽(31)
  • AI創(chuàng)作系統(tǒng)ChatGPT系統(tǒng)源碼,支持Midjourney繪畫,GPT語音對話+DALL-E3文生圖

    AI創(chuàng)作系統(tǒng)ChatGPT系統(tǒng)源碼,支持Midjourney繪畫,GPT語音對話+DALL-E3文生圖

    SparkAi創(chuàng)作系統(tǒng)是基于ChatGPT進(jìn)行開發(fā)的Ai智能問答系統(tǒng)和Midjourney繪畫系統(tǒng),支持OpenAI-GPT全模型+國內(nèi)AI全模型。本期針對源碼系統(tǒng)整體測試下來非常完美,可以說SparkAi是目前國內(nèi)一款的ChatGPT對接OpenAI軟件系統(tǒng)。那么如何搭建部署AI創(chuàng)作ChatGPT?小編這里寫一個詳細(xì)圖文教程吧!

    2024年02月04日
    瀏覽(28)
  • 最新國內(nèi)GPT4.0使用教程,AI繪畫,GPT語音對話使用,DALL-E3文生圖

    最新國內(nèi)GPT4.0使用教程,AI繪畫,GPT語音對話使用,DALL-E3文生圖

    ChatGPT3.5、GPT4.0、GPT語音對話、Midjourney繪畫,文檔對話總結(jié)+DALL-E3文生圖,相信對大家應(yīng)該不感到陌生吧?簡單來說,GPT-4技術(shù)比之前的GPT-3.5相對來說更加智能,會根據(jù)用戶的要求生成多種內(nèi)容甚至也可以和用戶進(jìn)行創(chuàng)作交流。 然而,GPT-4對普通用戶來說都是需要額外付費(fèi)才可

    2024年01月24日
    瀏覽(22)
  • 最新可用GPT-3.5、GPT-4、Midjourney繪畫、DALL-E3文生圖模型教程【寶藏級收藏】

    最新可用GPT-3.5、GPT-4、Midjourney繪畫、DALL-E3文生圖模型教程【寶藏級收藏】

    ChatGPT3.5、GPT4.0、GPT語音對話、Midjourney繪畫,文檔對話總結(jié)+DALL-E3文生圖,相信對大家應(yīng)該不感到陌生吧?簡單來說,GPT-4技術(shù)比之前的GPT-3.5相對來說更加智能,會根據(jù)用戶的要求生成多種內(nèi)容甚至也可以和用戶進(jìn)行創(chuàng)作交流。 然而,GPT-4對普通用戶來說都是需要額外付費(fèi)才可

    2024年01月17日
    瀏覽(22)
  • 最新AI創(chuàng)作系統(tǒng)ChatGPT系統(tǒng)源碼+DALL-E3文生圖+AI繪畫+GPT語音對話功能

    最新AI創(chuàng)作系統(tǒng)ChatGPT系統(tǒng)源碼+DALL-E3文生圖+AI繪畫+GPT語音對話功能

    SparkAi創(chuàng)作系統(tǒng)是基于ChatGPT進(jìn)行開發(fā)的Ai智能問答系統(tǒng)和Midjourney繪畫系統(tǒng),支持OpenAI-GPT全模型+國內(nèi)AI全模型。本期針對源碼系統(tǒng)整體測試下來非常完美,可以說SparkAi是目前國內(nèi)一款的ChatGPT對接OpenAI軟件系統(tǒng)。那么如何搭建部署AI創(chuàng)作ChatGPT?小編這里寫一個詳細(xì)圖文教程吧!

    2024年02月04日
    瀏覽(26)
  • AI創(chuàng)作系統(tǒng)ChatGPT商業(yè)運(yùn)營網(wǎng)站系統(tǒng)源碼,支持AI繪畫,GPT語音對話+DALL-E3文生圖

    AI創(chuàng)作系統(tǒng)ChatGPT商業(yè)運(yùn)營網(wǎng)站系統(tǒng)源碼,支持AI繪畫,GPT語音對話+DALL-E3文生圖

    SparkAi創(chuàng)作系統(tǒng)是基于ChatGPT進(jìn)行開發(fā)的Ai智能問答系統(tǒng)和Midjourney繪畫系統(tǒng),支持OpenAI-GPT全模型+國內(nèi)AI全模型。本期針對源碼系統(tǒng)整體測試下來非常完美,可以說SparkAi是目前國內(nèi)一款的ChatGPT對接OpenAI軟件系統(tǒng)。那么如何搭建部署AI創(chuàng)作ChatGPT?小編這里寫一個詳細(xì)圖文教程吧!

    2024年02月03日
    瀏覽(92)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包