關(guān)門測試的 DALL·E 2 昨日放出消息,說剛向社區(qū)投放了 1000 個內(nèi)測名額,趕緊奔去查我的郵箱!沒有!還是沒有,向幾位我認(rèn)識搞機(jī)器學(xué)習(xí)的大佬們托了人情也不行,沒有插隊(duì)的!(奔走掩面甩淚)
為什么那么多人在翹首期盼 DALL·E 2,看看下面這個創(chuàng)作實(shí)驗(yàn)就明白了。
這個實(shí)驗(yàn)文章的作者是 Tom Mason,Disco Diffusion 的開發(fā)者之一,為 DD 添加了 VR 模塊。跟他一起做對照實(shí)驗(yàn)(DALL·E 2 那邊)的是 Scott Gray @scottgray76,Openai 公司的?GPU Geek。
我跟?Tom Mason 在推上有過一些交流,所有內(nèi)容及實(shí)驗(yàn)結(jié)果均經(jīng)過作者本人授權(quán)翻譯發(fā)布。
同樣的 Prompt,DALL·E 2 跟 Disco Diffusion 的創(chuàng)作對比
“我在 Twitter 上與 OpenAI 的 Scott Gray 聊了一下,因?yàn)樗u論了我用 Disco Diffusion 創(chuàng)作的這張 “God out of the machine”。(見下面的第一組對比)
我使用 Disco 已經(jīng)有一段時(shí)間了,喜歡它的一切。所以我想在 DALL·E 2 和 Disco Diffusion 做一些對比測試。
這些 Prompt 中有不少是我花了好長時(shí)間才想出來的,但說實(shí)話,把它們都藏著掖著也沒什么意思。如果 OpenAI、DD 團(tuán)隊(duì)、Katherine Crowson 等都愿意開放他們的代碼,我當(dāng)然也可以分享 Prompt。我認(rèn)為這最終會讓大家都能夠做出更好的藝術(shù)作品。
(譯注:Katherine Crowson,??@RiversHaveWings?,?女,數(shù)據(jù)科學(xué)家、TTI 核心開發(fā)者,目前所有 Guided diffusion 模型的奠基者,也是她最初實(shí)現(xiàn)了 DD 的 notebook 化并?fine-tune 了 512x512 的擴(kuò)散模型)
另外需要說明的是,Scott 跟我做的這個實(shí)驗(yàn)是在他沒做任何準(zhǔn)備的情況下開始的。我對如何設(shè)計(jì)給 DD 的 Prompt 已經(jīng)頗有些心得了,但給 DALL·E 2 的 Prompt 可能需要針對其模型特點(diǎn)做一些調(diào)整,而 Scott 沒有時(shí)間去做。所以基于這點(diǎn),這個對比小實(shí)驗(yàn)可能略顯不公。但實(shí)驗(yàn)結(jié)果仍然很有趣。
關(guān)于這一點(diǎn),我真的很有興趣發(fā)展更有針對性的藝術(shù)合作,例如圍繞詩歌作為 Prompt 的動畫(我目前正在為柯勒律治的《忽必烈汗》 Kubla Khan by Coleridge 制作視頻。如果你有興趣在跟我一起為這個項(xiàng)目貢獻(xiàn)或一起去探索這種風(fēng)格,請聯(lián)系我。我認(rèn)為很多藝術(shù)運(yùn)動在過去都是這樣興起的,看到 AI 藝術(shù)社區(qū)能夠這樣去發(fā)展藝術(shù)子流派中將是很好的事,特別是在技術(shù)進(jìn)步如此之快的情況下。每次新技術(shù)的發(fā)布都將 AI 藝術(shù)的準(zhǔn)入門檻降低,所以我們必然應(yīng)當(dāng)不再只聚焦于技術(shù)的升級,而將注意力更多轉(zhuǎn)向藝術(shù)創(chuàng)作本身?
(譯注,《忽必烈汗》的英國詩人、哲學(xué)家和神學(xué)家——塞繆爾·泰勒·柯勒律治的長詩,英國浪漫主義詩歌代表作之一,寫于約 1797)
?Tom Mason ?的視頻項(xiàng)目最新版 :https://youtu.be/0H7vvC2oowY
在揭露這個有趣的實(shí)驗(yàn)之前,我只想說,感謝每一個為這些 TTI 項(xiàng)目工作的人,這是令人驚訝的前沿創(chuàng)新。我最近剛向開源社區(qū)做了一點(diǎn)小小的回報(bào),完成了 DD 的 VR 模塊,允許用戶輸出立體的 VR180,使用深度估計(jì)和變換(MiDaS)來生成左/右眼的影像。我還為 Pytorch 3D 寫了一個新的球形投影變換。如果 OpenAI 的任何人看到這篇文章 – 請聯(lián)系我們 DD 團(tuán)隊(duì) – 他們已經(jīng)建立了一個令人難以置信的動畫創(chuàng)作系統(tǒng),我們很愿意在通過一個合作項(xiàng)目中把它共享給 DALL·E 2。在實(shí)現(xiàn)流暢的動畫方面,我們積累了大量學(xué)習(xí)經(jīng)驗(yàn),很愿意分享。
Prompt #1 — A view of God being created from the machine, dystopian, volumetric light, warm,?unreal engine 3, by Felix Kahn
譯:從機(jī)器中創(chuàng)造的上帝,神秘主義,體積光照,暖色調(diào),虛幻引擎(權(quán)重:?3),F(xiàn)elix Kahn 風(fēng)格。
Disco Diffusion
DALL·E?2
Prompt #2 — A scenic view of a Scottish loch in the Isle of Skye
譯:斯凱島一個蘇格蘭湖泊的風(fēng)景圖
Disco Diffusion
DALL·E?2
———爬行動物警告,害怕的同學(xué)請滾過 2 屏——
Prompt #3 — A lady in a long white dress lying amongst many large snakes, tropical jungle, by Prateep Kochabua
譯:身穿白色長裙的女士躺在熱帶叢林的許多大蛇中間,Prateep Kochabua 風(fēng)格
Disco Diffusion
DALL·E?2
Prompt #4 — A scenic view of the construction of the Great Pyramid of Giza, by Canaletto
吉薩大金字塔建設(shè)的風(fēng)光圖,Canaletto 畫風(fēng)
Disco Diffusio
DALL·E?2
Prompt #5 — Elephants drinking from a swimming pool outside a suburban house
譯:大象在一家郊區(qū)房子的游泳池里喝水
Disco Diffusion?
失敗!Disco 在大象(和大多數(shù)動物)身上總是失敗
DALL·E?2
Prompt #6 — A group of angels having a board meeting in a summer garden, by Asher Brown Durand
譯:一群天使在夏日花園里開董事會,阿什·布朗·杜蘭德的畫風(fēng)
Disco Diffusion
DALL·E?2
Prompt #7 — A close-up view of a man meeting the devil, by Caravaggio
譯:一個男人與魔鬼會面的特寫鏡頭,卡拉瓦喬畫風(fēng)
Disco Diffusion
DALL·E?2
Prompt #8 — A scenic view of a lake in the fjords, by David Noton
譯:峽灣湖泊的風(fēng)景,David Noton 畫風(fēng)
Disco Diffusion
DALL·E?2
Prompt #9 — A view of the gateway to the Great Temple at Baalbec, by Paolo Veronese
譯:巴爾貝克大寺院的大門景觀,保羅-維羅內(nèi)塞 畫風(fēng)
Disco Diffusion
DALL·E?2
Prompt #10— A scenic view of the pleasure dome of Kubla Khan in the tropical jungle of Xanadu, by Asher Brown Durand
譯:忽必烈在仙納度熱帶叢林中的快樂穹頂小屋的風(fēng)景,Asher Brown Durand 畫風(fēng)
Disco Diffusion
DALL·E?2
Prompt #11 — A beautiful wilderness in which a lonely monolith glowing, by Asher Brown Durand
譯:美麗的荒野中一塊孤獨(dú)的方尖碑閃耀著光芒,Asher Brown Durand 畫風(fēng)
Disco Diffusion
DALL·E?2
譯注:DALL·E 2?居然未能正確“理解” 方尖碑 (monolith)這一在科幻和史詩奇幻文化里如此標(biāo)志性的文化符號,建議輸入 2001: A Space Odyssey 的圖像數(shù)據(jù)集訓(xùn)個五十遍。
感謝 Scott 陪我實(shí)驗(yàn)這些瘋狂的 Prompt。DALL·E 2 看起來很棒,但很難分析出用什么樣的 Prompt 可以對應(yīng)輸出什么樣風(fēng)格的作品。當(dāng)然它的連貫性和保真度肯定是現(xiàn)在行業(yè)天花板。
激動人心的時(shí)刻在前頭。
Tom Mason
https://twitter.com/nin_artificial
翻譯完了。
根據(jù)我參與的一些跑圖測試,我的感受和?Tom Mason 一致:DALL·E 在生成 生物體方面,結(jié)構(gòu)比 DD 正常多了,腿不會從胳肢窩里長出來,眼睛也不會長在腮幫子上。當(dāng)一個畫面里有多種對象時(shí),空間關(guān)系處理得非常好。高寫實(shí)的藝術(shù)畫風(fēng)得心應(yīng)手,生成照片的仿真度效果也都沒得說,但缺一些像 DD 那樣能完全出人意料的 “風(fēng)格感”、“藝術(shù)感”(arty)。
Tom Mason 認(rèn)為 DALL·E 2 較難用 Prompt 關(guān)鍵字去控制及預(yù)測作品的輸出風(fēng)格,我不是很同意?,F(xiàn)在針對 DALL·E 2 的 Prompt engineering 遠(yuǎn)遠(yuǎn)不夠量,我認(rèn)為 DALL·E 2 的可控性、可預(yù)測性比 DD 強(qiáng),但變化少,驚喜少。
另外,過去的一周我閱讀了很多關(guān)于兩代?DALL·E?的文檔、報(bào)道和論文(不敢說看懂),準(zhǔn)備好好寫一寫 DALL·E 這兩代的技術(shù)亮點(diǎn)、實(shí)現(xiàn)方式、不同體裁和風(fēng)格下的效果展示、以及它魔法的局限性和可能投下的陰影。還跟一些已經(jīng)拿到內(nèi)測資格的開發(fā)者及藝術(shù)家們搞了一些有意思的對比小實(shí)驗(yàn)。下周會發(fā)幾篇文,請關(guān)注。
寫東西很重要很有意思,可是玩 Prompt 和參數(shù)設(shè)置的癮頭一直在把我從工作中拖走,覺睡得少了,游戲更是沒空玩了。最近被我忽悠入坑了不少人,大概你們都能感受這種引力。
來吧,把錢包掏出來買顯卡!
00-人工智能輔助視覺藝術(shù)創(chuàng)作初探。AI 終于卷到了我頭上……
文章來源:http://www.zghlxwxcb.cn/news/detail-485980.html
AI 能理解和表達(dá)古詩意境嗎?來看看西喬用人工智能輔助創(chuàng)作的古風(fēng)插畫(第一輯)
文章來源地址http://www.zghlxwxcb.cn/news/detail-485980.html
到了這里,關(guān)于AI art 實(shí)驗(yàn):同樣的Prompt, DALLE2 跟 Disco Diffusion 的創(chuàng)作大比拼的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!