一、引言
7 月 26 日,Stability AI 發(fā)布了 SDXL 1.0,號(hào)稱目前為止,最厲害的開(kāi)放式圖像生成大模型。
它到底有沒(méi)有網(wǎng)上說(shuō)的那么炸裂?真的已經(jīng)實(shí)現(xiàn)了像 midjourney 一樣 靠嘴出圖 的功能嗎?相對(duì)于之前的版本,增加了哪些新特性?
今天體驗(yàn)了一把,一起來(lái)看看!
二、新特性
1、清晰的文字生成
大家都知道,目前的繪畫(huà)工具,對(duì)于文字生成的支持,還不是特別成熟。雖然有一些工具已經(jīng)可以生成文字了,但生成的總是不太能令人滿意。而 SDXL 1.0 在文字生成方面,又向前邁了一步。
比如通過(guò)短短一句提示詞:a cute cat holds a paper with text "cool",professional photography
,就可以生成一只拿著一張寫(xiě)著 “cool” 字樣的小貓。
2、更好的理解人體結(jié)構(gòu)
以前的 Stable Diffusino 模型,在生成正確的人體結(jié)構(gòu)方面,存在著明顯的問(wèn)題。比如經(jīng)常生成多余或者殘缺的四肢,以及極度畸形的臉等等。SDXL 1.0 在一定程度上解決了這個(gè)問(wèn)題。
我們都知道,AI 不擅長(zhǎng)畫(huà)手,比如之前為了生成一個(gè)正常的手,會(huì)加很多的負(fù)向提示詞、Embedding 或者使用 OpenPose 等插件,而在 SDXL 1.0 中,這些通通都不需要了,或者更確切地說(shuō),就算不用這些,生成的人物也比之前的版本也要好很多。
3、自由度大幅提升
在 SDXL 1.0 之前,如果想生成不同風(fēng)格的圖像,必須通過(guò)改變大模型或者下載相應(yīng)的 LoRA 模型來(lái)實(shí)現(xiàn),而在 SDXL 1.0 中,可以通過(guò)提示詞在十余種風(fēng)格間做無(wú)縫切換,包括動(dòng)漫、攝影、數(shù)字插畫(huà)等等。
4、更短的提示詞
在提示詞方面,咒語(yǔ)變得更短、更簡(jiǎn)單了,同時(shí)增強(qiáng)了對(duì)自然語(yǔ)言的理解,大大降低了我們寫(xiě)提示詞的門(mén)檻。
- 之前的提示詞,是由一個(gè)個(gè)單詞、詞語(yǔ)、逗號(hào)等符號(hào)組成的詞條化的描述,而在 SDXL 1.0 中,可以直接使用自然語(yǔ)言(比如一整個(gè)句子)來(lái)描述了。
- 之前的提示詞,在描述的時(shí)候,除了要寫(xiě)生成主體、場(chǎng)景、環(huán)境光線等提示詞之外,還需要添加例如 masterpiece、best quality、highres 等畫(huà)質(zhì)提示詞以及大量的負(fù)面提示詞。而在 SDXL 1.0 中,這些質(zhì)量提示詞以及負(fù)面提示詞,都不需要再寫(xiě)了。
- 對(duì)一些概念的理解以及對(duì)環(huán)境氛圍的還原更加到位了。對(duì)于概念的理解,官網(wǎng)給出了個(gè)例子:比如對(duì)于這兩個(gè)概念 “The Red Square”(一個(gè)著名的景點(diǎn))和 “red square”(一個(gè)形狀),SDXL 1.0 已經(jīng)可以區(qū)分他倆了。
5、支持更大尺寸和精度的照片
有 Stable Diffusion 出圖經(jīng)驗(yàn)的朋友都知道,之前如果直接生成 1024 x 1024 或更高分辨率的大圖,有可能會(huì)出現(xiàn)多人多頭、肢體錯(cuò)位等的現(xiàn)象,需要使用高清修復(fù)或者 Tiled Diffusion 等其他方法才能達(dá)到。
而現(xiàn)在,可以直接出 1024 x 1024 或更高分辨率的大圖了也不會(huì)有問(wèn)題了。
6、色彩的鮮艷度和準(zhǔn)確度
SDXL1.0 在色彩的鮮艷度和準(zhǔn)確度上做了很大改進(jìn),相對(duì)于之前版本,在對(duì)比度、光線和陰影上較之前版本更加真實(shí)了。
三、如何體驗(yàn) SDXL 1.0
1、Liblib AI
如果僅僅是為了體驗(yàn),推薦一個(gè)最簡(jiǎn)單快捷的在線方式:Liblib AI。
Liblib AI 在線出圖,一天可以免費(fèi)出圖 300 張,基本滿足大部分同學(xué)需求。
ps: Liblib AI 在線體驗(yàn)的缺點(diǎn)是,插件少,而且高峰期出圖可能會(huì)卡。簡(jiǎn)單體驗(yàn)還是可以,要想深度體驗(yàn),還是需要使用云部署 Stable Diffusion 或者本地部署 Stable Diffusion 的方式。
Liblib AI 體驗(yàn)步驟很簡(jiǎn)單,跟著操作,5 分鐘搞定!
- 在 Liblib AI 中,點(diǎn) “在線 Stable Diffusion”。
- 模型選擇帶 “SDXL” 的模型,然后輸入簡(jiǎn)單的提示詞。
- 參數(shù)設(shè)置。
如果不知道哪個(gè)參數(shù)出圖好,可以直接抄圖上的。
采樣方法:DPM++ 2M Karras(或其他)
采樣步數(shù):30
之前很多時(shí)候,我們一般會(huì)將采樣步數(shù)設(shè)置成 20,但在 SDXL 中,如果將采樣步數(shù)設(shè)置為 20,會(huì)讓人感覺(jué)圖片精細(xì)度不夠。因此可以將采樣步數(shù)適當(dāng)調(diào)大一些。
分辨率:1024 x 1024 或其他分辨率。太低可能會(huì)影響出圖質(zhì)量。
其他參數(shù):可以默認(rèn)即可。
- 點(diǎn)“生成圖片”。
一張使用 SDXL 1.0 生成的圖片就出來(lái)了,是不是很簡(jiǎn)單!
2、本地部署
溫馨提醒:需要先將本地的 Stable Diffusion WebUI 更新到 1.5.1。
如果之前本地沒(méi)有部署過(guò) Stable Diffusion WebUI,
Mac 電腦可以參考這篇:Mac 本地部署 Stable Diffusion(超詳細(xì),含踩坑點(diǎn))
Windows 電腦:直接使用秋葉大佬的一鍵部署安裝就可以了。
如果本地已經(jīng)安裝部署過(guò) Stable Diffusion WebUI 了,直接下載下面的兩個(gè) SDXL 1.0 的模型,放在 SDW 的根目錄/models/Stable-diffusion 目錄下即可。
SDXL 1.0 base model 下載
SDXL 1.0 refiner model 下載
這里大家可以發(fā)現(xiàn) SDXL 1.0 有兩個(gè)模型,一個(gè) base model,一個(gè) refiner model。在使用的時(shí)候,先通過(guò) base model 生圖,再選擇 “發(fā)送到圖生圖”,用 refiner model 進(jìn)行優(yōu)化。
第二步使用 refiner model 進(jìn)行優(yōu)化的過(guò)程,其實(shí)相當(dāng)于通過(guò)圖生圖進(jìn)行低幅度的重繪來(lái)提高圖片的畫(huà)質(zhì)(這里的重繪幅度不宜設(shè)置太高,比如 0.2、0.3 就 ok,也可以根據(jù)自己需求)。
當(dāng)然也可以不進(jìn)行第二步,只使用 base model 進(jìn)行圖像的生成。
出圖方式及具體的參數(shù)設(shè)置,參照上面 Liblib AI 的方式,這里就不再贅述了。
3、官方提供的方式
Stability AI 官方也提供了幾種體驗(yàn)方式:
四、目前的問(wèn)題
說(shuō)了半天,SDXL 1.0 多么強(qiáng)大,難道就真的無(wú)懈可擊了嗎?當(dāng)然不是!
1、一些舊模型、LoRA 模型以及 ControlNet 目前還不支持
比如大部分舊版的模型、LoRA 模型以及 ControlNet 等,用在 SDXL 1.0 上大部分都會(huì)失效,因?yàn)槟壳斑€不支持,需要重新更新才能適配 SDXL 1.0。
另外,SDXL 1.0 只是一個(gè)基礎(chǔ)大模型,就好比之前的 SD 1.4、SD 1.5,而我們?cè)谌粘@L畫(huà)時(shí),往往不會(huì)使用這些官方提供的基礎(chǔ)模型,而是使用經(jīng)過(guò)這些基礎(chǔ)模型進(jìn)行訓(xùn)練、微調(diào)、融合之后的特定模型。
比如我們想畫(huà)二次元風(fēng)格的圖片,會(huì)選擇 Cetus-Mix、Counterfeit、AbyssOrangeMix 等二次元風(fēng)格的大模型,而不會(huì)使用官方的基礎(chǔ)大模型。
如果我們想畫(huà)寫(xiě)實(shí)風(fēng)格的圖片,會(huì)選擇 Deliberate、LOFI、Realistic Vision 等大模型,也不會(huì)使用官方的基礎(chǔ)大模型。
在 SDXL 問(wèn)世之后,也會(huì)涌現(xiàn)出有很多基于 SDXL 訓(xùn)練、微調(diào)、融合而成的大模型。目前在 Liblib 等平臺(tái)上,已經(jīng)有基于 SDXL 訓(xùn)練的模型了,大家可以試用。而我們?nèi)蘸蟮睦L圖,大概率會(huì)使用這些基于基礎(chǔ)大模型訓(xùn)練、微調(diào)、融合而成模型,而不是目前官方提供的 SDXL 的模型。
也就是說(shuō),SDXL 1.0 目前只是一個(gè)過(guò)渡期產(chǎn)品,感興趣的嘗嘗鮮、提前了解一些知識(shí)還是可以的,但大規(guī)模的用于生產(chǎn),可能還需要一些時(shí)間。
2、太耗顯存
相對(duì)于之前的 Stable Diffusion 版本,明顯更耗顯存了。官方推薦在 8G 以上的顯存顯卡上或者云平臺(tái)上運(yùn)行。
五、總結(jié)
SDXL 1.0 給我們帶來(lái)最大的好處就是,基本可以實(shí)現(xiàn) 靠嘴出圖了,使出圖方式更加簡(jiǎn)單。
新手小白可以在完全不了解復(fù)雜的提示詞結(jié)構(gòu)、LoRA、Embedding、擴(kuò)展插件等知識(shí)的情況下,也可以使用自然語(yǔ)言輕松出圖了,大大降低了使用門(mén)檻。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-743970.html
后面肯定還會(huì)涌現(xiàn)出一批基于 SDXL 1.0 訓(xùn)練的大模型,到時(shí)候肯定會(huì)更加驚艷,一起期待一下吧!文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-743970.html
到了這里,關(guān)于Stable Diffusion 免費(fèi)升級(jí) SDXL 1.0,哪些新特性值得關(guān)注?體驗(yàn)如何?5 分鐘帶你體驗(yàn)!的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!