(零)前言
本篇主要介紹WEBUI的插件:StableSR:圖片超分辨放大的使用,以及和WEB UI附加功能圖片放大功能的對(duì)比。
更多不斷豐富的內(nèi)容參考:??《繼續(xù)Stable-Diffusion WEBUI方方面面研究(內(nèi)容索引)》
(一)圖片放大
之前通過《探索【Stable-Diffusion WEBUI】的附加功能:圖片縮放&摳圖》了解到,由于Stable-Diffusion并不適合生成很大的圖片,所以我們可以先生成適合的正常尺寸圖,再通過附加功能頁的放大功能,放大圖片。
同時(shí)介紹了好些縮放模型,其中有些效果挺好的。
特別是LDSR(潛在擴(kuò)散超分辨率模型)照片表現(xiàn)非常好,不僅腦補(bǔ)的細(xì)節(jié)多,還加入了很多噪點(diǎn)顯得真實(shí)。
但模型體積巨大+速度超級(jí)慢。放大一張512x512的圖,幾乎需要20分鐘(其它放大算法都是20秒內(nèi)……)。
所以,有沒有其它放大選擇呢?
(二)圖片超分辨率放大腳本插件(StableSR)
參考:??插件StableSR
可以從WEB UI中直接安裝,它是一個(gè)圖生圖的腳本。
安裝后會(huì)在圖生圖最下面的腳本下拉框中出現(xiàn)StableSR。
由于官網(wǎng)有中文說明,不需要細(xì)講了吧:)
簡單列舉下重點(diǎn),細(xì)節(jié)請(qǐng)看官網(wǎng)(倉庫)的中文說明。
對(duì)了:SR = Super-Resolution ,寫出來以防忘記。。。
(2.1)下載組件
安裝后需要下載模型才能使用(??細(xì)節(jié)請(qǐng)看官網(wǎng)介紹):
- Stable Diffusion V2.1 512 EMA 模型(約 5.21GB)->放基礎(chǔ)模型目錄。
- 官方的 StableSR 模塊 (約400MB)->放插件自己的模型目錄。
- 可選使用官方提供的 VQGAN VAE(約750MB) ->放VAE模型目錄。
-
可選配合 Tiled Diffusion & VAE 擴(kuò)展,也就是分區(qū)擴(kuò)散(Multi Diffusion)插件使用。
說是可選,咱普通顯存只能必選,否則稍大的圖就顯存不夠了。
(2.2)使用
基本使用很簡單,在圖生圖下面啟用腳本就可以了。
主要步驟如下,官網(wǎng)還給出了具體參數(shù)配置的建議(??細(xì)節(jié)請(qǐng)看官網(wǎng)介紹)。
- 基礎(chǔ)模型選擇剛才下載的
v2-1_512-ema-pruned
模型。 - 切換到 img2img 標(biāo)簽。在頁面底部找到 “腳本” 下拉列表,選擇
StableSR
腳本。
點(diǎn)擊刷新按鈕,選剛才下載的 StableSR 模塊。 - 如果生成圖像尺寸 > 512,推薦使用 Tiled Diffusion & VAE(也就是Multi Diffusion upscaler)。
- 上傳圖像并開始生成。
我試了一下速度還不算太慢(比一般算法慢多了)。
一張5122的圖大概5-6分鐘吧(還是比LDSR快不少啊)。
?? 不過需要注意:
- 中低顯存下,不能打開
Channels Last
內(nèi)存格式優(yōu)化,否則報(bào)錯(cuò)。 - 不要嘗試放大特別小的圖片(48x48一類?)?? 。
- 紋理類可以腦補(bǔ)的細(xì)節(jié)很不錯(cuò)。但文字類需要“原樣放大”的效果很差,看不出原文。
這種情況請(qǐng)對(duì)比4x-UltraSharp
,R-ESRGAN 4x+
等附加功能頁圖片放大的效果。 - 使用SD2.1的基礎(chǔ)模型時(shí),嵌入式(embeddings)模型可能會(huì)暫時(shí)看不見,正常的,因?yàn)槟切┦墙oSD1.5用的。
- 注意版權(quán)問題,目前由于版權(quán)協(xié)議,生成的圖片不能商用。
(2.3)實(shí)例對(duì)比(放大)
下面這張圖(請(qǐng)忽略AI生成導(dǎo)致不合理的部分),我們來把它放大4倍。
放大后實(shí)在是太大了,就給個(gè)局部裁剪吧。
局部:原圖直接縮放(傳統(tǒng)圖像編輯軟件,對(duì)比組)
局部:StableSR
局部:StableSR(純?cè)肼曔x項(xiàng)開)
純?cè)肼曔m合腦補(bǔ)肌膚紋理,植物人群,各種不太需要和原圖一致的細(xì)節(jié)。細(xì)節(jié)多,顯得更加清晰。
但是改變?cè)瓐D較多,不適合文字之類。有時(shí)也會(huì)生成莫名奇妙的東西。
局部:LDSR(最強(qiáng)對(duì)比組)
噪點(diǎn)多顯得真實(shí),但噪點(diǎn)真的太多了。而且沒有色彩修復(fù)選項(xiàng)(關(guān)鍵是太慢,其它可以忍)。
(2.4)實(shí)例對(duì)比(修復(fù))
下面這張是比較早時(shí)自己拍的照片,那時(shí)相機(jī)不行,即使縮小看也很模糊。
我們不放大它的分辨率,處理看看。
局部100%:座機(jī)拍的原圖
局部100%:StableSR
整體清晰了不少,文字,欄桿,樹葉等。
不過截圖外遠(yuǎn)處人的樣子已經(jīng)沒法看了。
局部100%:StableSR(純?cè)肼曔x項(xiàng)開)
AI生成(腦補(bǔ))的細(xì)節(jié)更多,已經(jīng)明顯改變?cè)瓐D了,比如牌匾字體破損的位置,而且整體有點(diǎn)卡通化。
草地上有個(gè)藍(lán)色的牌子(雖然看不清寫的啥),徹底被弄沒了。
(三)總結(jié)
插件非常適合可以腦補(bǔ)細(xì)節(jié)的圖片放大,相對(duì)LDSR來說不算太慢。
但操作相對(duì)復(fù)雜,還需要配合分區(qū)擴(kuò)散插件(不然就爆顯存,參數(shù)設(shè)不對(duì)也爆顯存)。文章來源:http://www.zghlxwxcb.cn/news/detail-493056.html
總之它給了我們一個(gè)新的選擇,期待持續(xù)改進(jìn)。文章來源地址http://www.zghlxwxcb.cn/news/detail-493056.html
到了這里,關(guān)于探索【Stable-Diffusion WEBUI】的圖片超分辨插件:StableSR的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!