国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Stable Diffusion學習指南【圖生圖篇】

這篇具有很好參考價值的文章主要介紹了Stable Diffusion學習指南【圖生圖篇】。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

即使之前在Midjourney中有過圖生圖的使用經(jīng)驗,但大部分人對該功能的印象僅限于喂圖,通過它可以讓模型了解更多我們要傳達的信息,從而達到準確出圖的目的。但在Stable Diffusion中的圖生圖還要強大的多,除了控圖還包含了手動涂鴉、局部重繪、圖像擴展等更多功能。

今天的文章里我會為你詳細介紹圖生圖的工作原理、工具解析和圖像重繪的應用方向,如果沒有看過【文生圖篇】的朋友建議先去學習下,以便你更好的理解今天的內(nèi)容。

Stable Diffusion學習指南系列文章:

01?Stable Diffusion學習指南【初識篇】

02?Stable Diffusion學習指南【安裝篇】

03?Stable Diffusion學習指南【文生圖篇】

04?Stable Diffusion學習指南【模型篇】


圖生圖功能初識

1.1 傳統(tǒng)意義上的喂參考圖

我們都知道,模型在運算時是根據(jù)我們提供的提示內(nèi)容來確定繪圖方向,如果沒有提示信息,模型只能根據(jù)此前的學習經(jīng)驗來自行發(fā)揮。在之前的文生圖篇,我們介紹了如何通過提示詞來控制圖像內(nèi)容,但想要實現(xiàn)準確的出圖效果,只靠簡短的提示詞是很難滿足實際需求的。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

AI繪畫的隨機性導致我們使用大段的提示詞來精確描述我們想要的畫面內(nèi)容,但畢竟文字能承載的信息量有限,即使我們寫了一大段咒語,模型也未必能準確理解,不排除有時候還會出現(xiàn)前后語義沖突的情況。其實這個過程就像甲方給我們明確設計方向,除了重復溝通想要的畫面內(nèi)容外,有沒有什么比口述更高效的溝通方式呢?這個時候,有經(jīng)驗的甲方會先去找?guī)讖埬繕孙L格的競品圖,讓我們直接按照參考圖的感覺走。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

【感覺】這個詞聽起來似乎虛無縹緲,但在AI繪畫領域是有實際道理的,因為圖像能承載的信息要比文字多得多。以上面這張圖為例,如果用提示詞描述,可能寫上幾百字都難以向模型解釋清楚畫面的內(nèi)容,但圖生圖不同,模型會自動從參考圖上提取像素信息,并將其作為特征向量準確映射到最終的繪圖結果上,通過這樣的方式能最大程度還原參考圖中的提示信息,實現(xiàn)更穩(wěn)定準確的出圖效果。

因此,傳統(tǒng)意義上的圖生圖就是將提示詞和參考圖中的圖像信息進行綜合考慮并進行繪圖的過程。

1.2 真正強大的圖像重繪

當然,如果僅僅是喂圖功能,Stable Diffusion的圖生圖板塊并不值得我們單獨花一篇文章來講解,它的真正價值在于提供了豐富的操作工具將圖像可控性提升到了新的層次。

我們先來回顧下平時使用文生圖進行AI繪畫的過程:編寫提示詞進行繪圖,然后根據(jù)出圖結果再不斷優(yōu)化提示詞和各類參數(shù)進行抽獎,最終得到一張比較滿意的圖片。而圖生圖則是直接根據(jù)現(xiàn)有圖片進行優(yōu)化調(diào)整,因此圖生圖的操作過程可以簡單理解成省去了前期文生圖的抽獎過程,直接在現(xiàn)有圖像約束的基礎上進行的二次重繪。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

需要注意的是,配合參考圖進行圖生圖的過程是需要將參考圖先逆向推導為潛空間的數(shù)據(jù),再和提示詞綜合考慮繪制成圖像。因此相比沒有逆向推導過程的文生圖,圖生圖的繪制會占用更多的系統(tǒng)資源,根據(jù)這個原理,我們也就能理解使用參考圖的尺寸越大,在逆向推導的過程中消耗的資源也會越多。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

在Stable Diffusion中,我們可以通過蒙版和局部重繪等功能來控制只對圖像特定部分的區(qū)域進行重繪,并設置各類參數(shù)來控制重繪的效果。此外通過選擇不同的繪圖模型和調(diào)整圖像尺寸,我們也能甚至還能實現(xiàn)畫風轉換、圖像無損放大等更多玩法。相較于其他AI繪畫工具,Stable Diffusion中的圖生圖并非單純的喂參考圖,而是可以在現(xiàn)有圖片的基礎上通過人工干預來實現(xiàn)更加穩(wěn)定可控的圖像重繪。

圖生圖工具解析

在WebUI的功能導航欄中選擇圖生圖模塊,我們可以看到它的頁面布局和文生圖基本類似,同樣有提示詞輸入框、操作按鈕和參數(shù)設置項,不同的是這里多了提示詞反推、支持上傳圖片的二級功能模塊和對應的參數(shù)設置項。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

2.1 提示詞反推

先來看提示詞反推的功能:即根據(jù)提供的圖片自動反推出匹配的文本關鍵詞,也就是我們俗稱的圖生文功能。WebUI這里提供了Clip反推DeepBooru反推2種反推操作,其區(qū)別在于:

  • Clip反推:推導出的文本傾向于自然語言的描述方式,即完整的描述短句,該功能的特點是可以描述出畫面中對象間的關系

  • DeepBooru反推:推導結果更多的是單詞或短句,比較類似我們平時書寫提示詞的方式,該功能更傾向于描述對象特征

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

不難看出,通過Clip和DeepBooru反推的提示詞中包含不少錯誤標簽,需要人工進行二次篩選。其實,WebUI在圖生圖模塊內(nèi)置提示詞反推是為了在上傳圖片后可直接獲取相應的參考關鍵詞,以便后面更好的通過提示詞來控制重繪圖像內(nèi)容。但實際上我們平時反推提示詞時更常使用的是秋葉整合包中自帶的Tagger插件,該插件除了生成的提示詞準確度和穩(wěn)定更高,還提供了關鍵詞分析和排名展示,屬于Stable Diffusion的必備插件之一。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

在Stable Diffusion中有非常多類似的開源插件可以有效提升繪圖效率,但不屬于本篇文章重點,這里就不過多介紹了。

2.2 二級工具欄概覽

在圖生圖模塊中為我們內(nèi)置了許多二級工具欄,很多朋友看到這樣可能會擔心學習起來很復雜。但其實這里每款工具其實都是在上一個工具基礎上進行的衍生,比如涂鴉和局部重繪是在原生圖生圖基礎上增加了手繪和蒙版,而涂鴉重繪又是這2款工具的結合。系統(tǒng)來看,所有的二級工具都是圍繞圖像重繪、手繪涂鴉和蒙版選區(qū)這3個基礎功能所進行的重組,而WebUI作者是為了方便我們使用將實際操作場景進行了細分。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

上圖中整理了不同工具的簡介和差異對比,下面針對每款工具和相關參數(shù)為大家進行詳細介紹。

2.3 圖生圖工具

這部分的操作和文生圖基本相同,區(qū)別在于支持額外上傳參考圖并增加了幾項圖生圖專屬的參數(shù)。下面介紹幾項影響圖生圖效果的重要參數(shù),這也是所有二級模塊都需要用到的參數(shù),其中和文生圖模塊中相同的參數(shù)這里就不再贅述了,大家可以回顧下【文生圖篇】的相關內(nèi)容。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

2.3.1 重繪幅度

重繪幅度可以說是圖生圖中最重要的參數(shù),它的功能有點類似Midjourney中的iw參數(shù)。前面介紹圖生圖的原理是在原圖基礎上繪制一張新的圖片,而重繪幅度就是用來控制在原圖基礎上重繪的發(fā)散性程度,數(shù)值越高,說明模型重繪過程中更加自由,繪制結果和原參考圖的差異性越大,生成的圖像也就更傾向于模型自身的繪圖風格。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

可以看到當重繪幅度過高時,繪制的圖像內(nèi)容和原圖基本就很難進行關聯(lián)了,因此我們通常將重繪幅度的數(shù)值控制在0.4~0.8之間,這樣既能維持參考圖的控圖效果,又能保證重繪后不會發(fā)生太強烈的變化。但從重繪幅度角度來看圖像可操作的范圍并不大,該參數(shù)的更多場景是配合其他功能項進行靈活調(diào)節(jié),在下面的內(nèi)容中我會配合各類工具進行詳細介紹。

2.3.2 重繪尺寸

故名思義,該參數(shù)用于設置重繪后的圖像尺寸,可以分為直接設置圖像寬高設置圖像縮放倍數(shù)2種調(diào)節(jié)方式。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

默認情況下重繪尺寸會自動帶入當前參考圖的寬高數(shù)值,而當我們拖動尺寸滑塊時,可以直觀的在參考圖上預覽重繪后的圖像范圍。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

2.3.3 縮放模式

很多時候我們的參考圖和重繪后的圖片尺寸并不一致,而縮放模式就是用來選擇采用何種變形方式來處理圖像。這里雖然提供了4個按鈕,但是可以分為2類場景來使用。一種是圖像長寬比發(fā)生變化時使用,這里提供了3種我們常見的處理方式:拉伸、裁剪、填充(由于漢譯插件不同,在名稱上存在一定差異)。另一種是圖像長寬比例不變時使用,多數(shù)情況下用于圖像等比放大。

換句話說,如果重繪后的圖像尺寸和原圖完全一樣,這幾種縮放模式使用起來并沒有區(qū)別。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

下面我們來挨個介紹不同縮放模式的效果差異。首先是拉伸模式(僅調(diào)整大?。?/strong>,它的效果是將原圖直接變形拉伸至新設定的尺寸。在下面的圖中可以看到,在重繪幅度參數(shù)設置為0時,圖像被直接變形拉伸為正方形,而隨著提升重繪幅度,變形效果逐漸得到緩解,但同樣也會導致和原圖差異過大。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

第二種裁剪模式(即裁剪后縮放)是根據(jù)新設定圖像的長寬比,對原參考圖的內(nèi)容進行裁切。重繪后尺寸由矩形變?yōu)檎叫?,上下部分?nèi)容被裁切,這里的重繪幅度參數(shù)不會對圖像的長寬比例產(chǎn)生影響。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

第三個填充模式(縮放后填充空白)的效果根據(jù)新設定的長寬比例,將原圖缺失的部分進行繪制填充。比如當圖像從原圖的512*768重繪為768*768時,下圖的效果就是向左右填充了新的背景內(nèi)容,且隨著重繪幅度數(shù)值越大,填充部分和原圖的融合效果越好。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

最后一種縮放模式叫調(diào)整大小(潛空間放大),有的地方也叫直接縮放,該功能主要用于對圖像進行等比放大,實現(xiàn)“小圖轉大圖”的效果。當然如果重繪尺寸比例和原圖比例不一致,則默認會采用拉伸的方式進行處理,但由于是反饋到潛空間中進行運算,因此圖像出現(xiàn)了模糊變形的效果。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

相較于單純增加分辨率的放大做法,圖生圖中使用調(diào)整大小模式有重繪幅度參數(shù)可供調(diào)節(jié),少量的重繪幅度可以為原圖增加更多細節(jié)。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

當然添加重繪幅度的弊端是不可避免的會導致圖像發(fā)生改變,想要實現(xiàn)更好的效果還有更多定制插件可以實現(xiàn)低顯存繪制高清大圖,此處先按下不表。

對于調(diào)整大小功能的潛空間放大算法,我們可以在設置-放大-圖生圖放大算法中進行切換,選擇之后記得保存設置并重啟webUI界面。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

綜合使用場景來看,除非是需要對圖像進行畫布拓展,否則多數(shù)情況下還是建議先將參考圖裁剪到目標比例再導入圖生圖中使用,這樣的出圖效果會更加可控。

下面我們再來看看圖生圖模塊下的其他二級工具及參數(shù),由于漢化差異,二級工具的名稱可能不同,比如涂鴉重繪有的翻譯插件下也被稱作有色蒙版重繪。

2.4 涂鴉工具

再來看看第二個涂鴉工具,涂鴉工具的參數(shù)項和圖生圖完全相同,唯一區(qū)別是上傳圖像后右上角多了畫筆工具,支持我們對圖像進行涂抹。涂鴉工具相當于增加了我們傳統(tǒng)的手繪過程,在圖片上涂抹色塊后再進行全圖范圍的圖生圖,同時配合提示詞可以實現(xiàn)更加多樣的重繪效果。

其中畫筆支持調(diào)整調(diào)整筆觸大小和切換顏色,自帶的吸色工具也可以進行全屏幕范圍內(nèi)的取色。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

在這幾個操作工具中,返回上一步的按鈕目前還存在bug,有時候并不會逐步撤回而是將整個涂鴉筆觸全部清空。并且由于不知名原因,上傳的圖片有時候會出現(xiàn)報錯或失效等情況,需要刪除當前圖片后重新上傳才能。

涂鴉工具的操作很簡單,使用畫筆在圖像上涂抹顏色后點擊生成,Stable Diffusion會將手繪后的圖像進行整體重繪,同時控制重繪幅度和增加描述關鍵詞可以實現(xiàn)非常神奇的融圖效果。在下圖中可以看到女孩的衣服會根據(jù)涂鴉部分重繪成紫色的運動服,當重繪幅度設置為0.5左右時達到比較自然的融合效果。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

需要注意的是通過涂鴉工具來重繪圖像時,由于重繪幅度的影響,畫面中未被涂鴉的部分也會發(fā)生變化,因此涂鴉工具是針對畫面整體進行重繪。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

由于鼠標涂鴉的繪制效果不夠準確,而且涂抹的顏色不支持透明度等細節(jié)調(diào)整,因此涂鴉工具平時使用并不多,一般都是導入PS中進行細致的繪制操作,這里就不做過多贅述了。

2.5 局部重繪工具

再來看看局部重繪工具,在前幾天,Midjourney終于上架了大家期待已久的局部重繪功能,應該算得上是Midjourney目前在控圖方向上最大的一次邁步,而Stable Diffusion在這塊算得上是深耕已久。簡單來說,局部重繪就是在圖像中設定一塊區(qū)域,在圖生圖過程中只針對該區(qū)域部分進行重繪,而其他部分保持不變,從而實現(xiàn)精準控制改變圖像特定部分的效果。該功能通常用于對畫面大部分內(nèi)容都基本滿意,但需要調(diào)整部分細節(jié)元素的場景。

在下圖中可以看到,局部重繪同樣是使用畫筆進行涂抹,但這里涂抹的顏色只有黑色,因為被涂抹區(qū)域表示的是蒙版,而不是實際的顏色色塊。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

下面我們來看看局部重繪的各項參數(shù)。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

蒙版邊緣模糊度:該參數(shù)用于設置重繪區(qū)域和原圖的融合程度,效果可以簡單理解為PS中的選區(qū)羽化。邊緣模糊度太小會導致邊緣銜接過于生硬,而數(shù)值太高會削弱蒙版的區(qū)域限制效果,導致蒙版不精確或直接失效。默認情況下數(shù)值是4,我們可以根據(jù)圖像的融合效果來進行適度調(diào)節(jié)。

為方便對比蒙版效果,在下圖的案例中我選擇重繪黑色蒙版之外的區(qū)域,可以發(fā)現(xiàn)當邊緣模糊度為0時,蒙版邊緣非常生硬,而隨著數(shù)值變大,重繪區(qū)域和原圖的融合過渡也變得更加自然。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

蒙版模式:【重繪蒙版區(qū)域】表示重繪涂抹過的蒙版區(qū)域,【重繪非蒙版區(qū)域】表示涂抹區(qū)域不變,而是重繪畫面中的其他區(qū)域。該參數(shù)類似PS中的選區(qū)反轉,在實際使用時根據(jù)重繪區(qū)域大小自由選擇是涂抹需要重繪的部分還是剩余的背景部分。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

蒙版區(qū)域內(nèi)容處理:該選項用于設置重繪時的圖像處理方式,這里提供了4個選項:填充、原圖、潛空間噪聲、空白潛空間,具體的效果可以看下圖,相較之下潛空間噪聲會比其他幾項產(chǎn)生出更多變化,而原圖的效果比較穩(wěn)定。

該參數(shù)對繪圖結果的影響不太穩(wěn)定,一般情況下保持默認的【原圖】即可。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

重繪區(qū)域:指的是重繪過程中用于參考的圖像范圍。在下圖中可以清楚的看到,當重繪區(qū)域設置為【僅蒙版區(qū)域】時,繪制的部分只有涂抹的蒙版部分區(qū)域的元素,相當于把涂抹區(qū)域切割下來單獨進行重繪,該選項下會打斷選區(qū)和參考圖其他部分的聯(lián)系,最終畫面的融合效果可能會下降。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

僅蒙版區(qū)域下邊緣預留像素:該參數(shù)只在重繪區(qū)域選擇了【僅蒙版區(qū)域】時生效,用于控制切割下來重繪部分向外擴展的范圍大小。觀察下面重繪過程的進度圖可以發(fā)現(xiàn),邊緣預留像素的數(shù)值越大,則繪制過程中會向四周裁剪更多的內(nèi)容進行整體重繪。

在默認情況下局部重繪會參考全圖進行繪制,并且被涂抹的范圍并不代表都會發(fā)生變化,所以通常我們會在目標區(qū)域基礎上對外再涂抹一部分區(qū)域,以保證重繪后更好的融合效果,而提高邊緣預留像素也是同樣的原理。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

總結來看,由于手涂蒙版的方式比較方便也很自由,因此局部重繪被廣泛用于圖像的局部調(diào)整,比如常見的臉部修復、手部修復等。

2.6 涂鴉重繪工具

涂鴉重繪工具可以理解為涂鴉+蒙版的結合,相當于在涂抹顏色的同時加上了局部重繪的蒙版,只不過這個過程中顏色涂抹和蒙版繪制是同時進行的。因此和局部重繪相比,涂鴉重繪多了一個參數(shù)項:蒙版透明度。

蒙版透明度設置的是涂抹色塊在畫面中的呈現(xiàn)效果:當透明度設置為0時涂抹顏色完全覆蓋下方圖片,此時等同于涂鴉工具的效果,50%時相當于半透明色塊,而達到100%時蒙版完全透明,相當于色塊消失。需要注意的是,當透明度過高時涂抹色塊可能無法被Stable Diffusion準確識別,繪制結果中會直接呈現(xiàn)出半透明色塊效果(如下圖中的50%透明度時)。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

下面舉個實際案例,我們希望實現(xiàn)長裙變短裙的效果。如果只是單純的局部重繪,重繪的部分始終會受到原圖其他部分的影響出現(xiàn)裙擺,但這里的重繪幅度又不能調(diào)整過高,否則和原圖會產(chǎn)生明顯的割裂感。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

但使用了涂鴉重繪相當于給Stable Diffusion提供了大概的范圍參考,并且由于可以自由設置繪制色塊的不透明度,不用擔心完全覆蓋原圖內(nèi)容,在整個重繪操控上更加準確和穩(wěn)定。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

對比來看,涂鴉重繪比單純的涂鴉工具多了蒙版的局部控圖效果,又比局部重繪工具多了顏色的指導作用,可以說是兩款工具的結合體。

2.7 上傳重繪蒙版工具

雖然涂鴉重繪效果很好,但畢竟手動涂抹的方式不夠準確,因此WebUI也提供了自行上傳蒙版的方法來精準控制重繪區(qū)域。上傳重繪蒙版和局部重繪的頁面基本相同,區(qū)別在于支持額外上傳一張已繪制好的蒙版圖。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

這里蒙版圖片的顏色含義和PS中的蒙版相同,白色表示有內(nèi)容,黑色表示為空,因此白色區(qū)域內(nèi)的圖像會被進行重繪。相信很多朋友都出現(xiàn)過黑白蒙版傻傻分不清楚的情況,這里給大家分享個小妙招。我們只要將蒙版圖想象成黑板即可,黑色表示默認的空白,白色即粉筆填充后的內(nèi)容。

需要注意的是,在Stable Diffusion中表示半透明蒙版的灰色并不適用,因此像黑白漸變的蒙版圖不起效果,我們平時用黑白純色即可。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

上傳蒙版的優(yōu)勢在于我們可以精準控制蒙版范圍,通常在PS中進行摳圖并填充成黑白蒙版圖,再上傳到Stable Diffusion中進行使用。

2.8 批量處理工具

最后還有個批量處理工具,顧名思義可以批量對圖像進行重繪操作。只需設置到相關參數(shù)和提示詞,設置到參考圖文件夾和輸出文件夾就能實現(xiàn)批量重繪。我們平時在抖音上看到那種用拍攝視頻轉換AI繪圖視頻也是同樣的原理,通過將視頻拆解成逐幀圖片再進行重繪,但目前開源社區(qū)中有用于制作動態(tài)視頻更好用的插件,這里就不再贅述了。

關于圖生圖的更多知識

由于各款工具的名稱都比較相似,加上不同功能項的調(diào)節(jié)參數(shù)和使用方法都不同,新手在學習圖生圖模塊時很容易把各類功能弄混淆。因此,在學習這類AI繪畫工具時,我更建議大家按照下面重繪應用方向的思路來理解,而不是單純的從工具角度學習。

3.1 重繪的3個應用方向

我們前面提到圖生圖的本質(zhì)是進行圖像的二次重繪,根據(jù)繪制區(qū)域的差異,可以將重繪功能劃分為整體重繪、局部重繪和圖像擴展三個方向:

  • 整體重繪 Img2img:按照原圖的比例進行整體重繪,即傳統(tǒng)意義上的基于參考圖進行圖生圖,需要注意的是圖像比例不變,但尺寸可以等比例調(diào)整。

  • 局部重繪 Inpaint:通過手動涂鴉或上傳蒙版等方法控制只針對指定區(qū)域進行重新繪制。

  • 圖像拓展 Outpaint:在原畫布尺寸基礎上向其他方向拓展,添加更多原畫布外的內(nèi)容。

回過頭來看,文生圖、圖生圖、涂鴉都相當于整體重繪功能,而局部重繪、涂鴉重繪和上傳重繪蒙版則是局部重繪功能,至于圖像擴展則是在圖像比例發(fā)生變化且縮放模式選擇填充時啟用。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

我們橫向?qū)Ρ绕渌ぞ邅砜?,整體重繪、局部重繪和圖像擴展可以說是所有圖像處理工具的基礎功能,畢竟可控性在商業(yè)領域的價值很多時候比創(chuàng)意性更加重要,而可以將兩者結合起來靈活使用的AI繪畫工具才稱得上是行業(yè)翹楚。這也是為什么PS的創(chuàng)意生成和畫布拓展繪制功能剛一推出就引起廣泛熱議,而像Midjourney近期更新的Zoom Out圖像擴展和Vary(Region)局部重繪等功能同樣也是在向控圖穩(wěn)定性方向發(fā)展。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

3.2 圖生圖中的提示詞

前面提到圖生圖本質(zhì)是增加了參考圖的約束,雖然提示詞的信息權重被參考圖削弱了一部分,但并不意味著提示詞就沒用了。相反,很多時候還是需要通過提示詞來告訴Stable Diffusion我們希望繪制的內(nèi)容。這時候有朋友會問,那我們是只填寫需要重繪部分的內(nèi)容還是將畫面全部內(nèi)容進行完整描述呢?其實,圖生圖的提示詞填寫要根據(jù)實際的出圖效果來調(diào)整。

當我們只希望更改畫面中的部分元素而其他部分不變時,就需要在提示詞中將不更改的部分進行保留,并對修改部分進行調(diào)整或補充描述,為了保證出圖效果還可以靈活增加對應關鍵詞的權重。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

而當局部重繪時,如果繪制部分和原有圖像的融合效果不佳,我們可以增加蒙版部分之外的內(nèi)容描述來加強和畫面其他部分的聯(lián)系,比如下面的圖中通過交互動作來增加重繪后手部和環(huán)境的融合效果。

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫

以上案例只針對提示詞進行了調(diào)整,實際使用時像seed值、重繪幅度、繪圖模型等因素也要進行靈活考慮。

3.3 圖生圖和高清修復

如果有仔細觀察的小伙伴應該已經(jīng)發(fā)現(xiàn)了,圖生圖中并沒有提供文生圖中的高清修復選項,這是因為高清修復的本質(zhì)就是進行了一次額外圖生圖操作,同樣是先生成小圖再進行放大,所以在圖生圖中想實現(xiàn)高清修復,只需將圖像尺寸調(diào)大進行重繪即可,此外高清修復這一特性在圖生圖中有更多使用場景。

不知道大家平時是否發(fā)現(xiàn)過這樣的現(xiàn)象,當人物在畫面中占比越小,出圖結果中出現(xiàn)臉部崩壞的情況就越常見,而當對人物臉部特寫時很少出現(xiàn)崩壞情況。這是因為Stable Diffusion模型在逆向擴散的過程中對大區(qū)域的圖像去噪處理會更加清晰,因此更擅長繪制畫面中占比大的事物,通過利用這一點我們可以將圖像中不清晰的小圖截取出來進行放大重繪,然后再放回原圖位置,即可有效修復局部變形的情況。


在今天文章里,我為大家介紹了Stable Diffusion中圖像重繪的作用、各類工具和參數(shù)的功能解析以及關于圖像重繪的學習思路。相比于文生圖的一步成型,圖生圖更多是碎片化的使用思路,需要通過不斷的修飾和調(diào)整局部細節(jié)來得到我們想要的圖片。

回顧近幾篇的文章內(nèi)容,從文生圖到圖生圖,從局部重繪再到上傳重繪蒙版,不難發(fā)現(xiàn)我們對Stable Diffusion的學習是從發(fā)散向可控的方向逐漸遞進,而聊到可控性就不得不提Stable Diffusion中大名鼎鼎的ControlNet,在下篇文章中我會為你詳細介紹這款真正讓Stable Diffusion立足AI繪畫之巔的神級插件。今天文章就到這里結束啦,我們下期再見??

如果想學習更多Stable Diffusion相關知識或者有相關問題,歡迎加入我的粉絲交流群共同探討????

stable diffusion 圖生圖,Stable Diffusion,stable diffusion,人工智能,AIGC,AI作畫文章來源地址http://www.zghlxwxcb.cn/news/detail-773937.html

到了這里,關于Stable Diffusion學習指南【圖生圖篇】的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • AI 繪畫 | Stable Diffusion 圖生圖

    AI 繪畫 | Stable Diffusion 圖生圖

    Stable Diffusion 不僅可以文生圖,還可以圖生圖。文生圖就是完全用提示詞文本去生成我們想要圖片,但是很多時候會有詞不達意的感覺。就像我們房子裝修一樣,我們只是通過文字描述很難表達出準確的想要的裝修效果,如果能給到一張設計圖或者效果圖,那么就能更加直白

    2024年02月03日
    瀏覽(30)
  • Stable Diffusion 系列教程 | 圖生圖基礎

    Stable Diffusion 系列教程 | 圖生圖基礎

    前段時間有一個風靡全網(wǎng)的真人轉漫畫風格,受到了大家的喜歡 而在SD里,就可以通過圖生圖來實現(xiàn)類似的效果 當然圖生圖還有更好玩的應用,我們一點一點來探索 首先我們來簡單進行一下圖生圖的這一個實踐---真人轉動漫 和文生圖基本界面差不多,多了一個上傳圖像區(qū)

    2024年02月11日
    瀏覽(27)
  • Stable Diffusion高清修復老照片-圖生圖

    Stable Diffusion高清修復老照片-圖生圖

    修復老照片的意義就不多說了,相信大家都明白,這里直接開講方法。 1、原理 這個方法需要一個真實模型,以便讓修復的照片看起來比較真實,我這里選擇:realisticVisionV20,大家有更好的給我推薦哦。 還需用搭配兩個特殊設置: ControlNet Tile:這是一個ControlNet模型,用于放

    2024年02月14日
    瀏覽(24)
  • Stable Diffusion教程:4000字說清楚圖生圖

    Stable Diffusion教程:4000字說清楚圖生圖

    原文:Stable Diffusion教程:4000字說清楚圖生圖 - 知乎 目錄 收起 基本使用 涂鴉繪制 局部繪制 局部繪制(涂鴉蒙版) 局部繪制(上傳蒙版) 批量處理 總結 資源下載 “圖生圖”是 Stable Diffusion的 核心功能之一,它的主要能力是根據(jù)現(xiàn)有的圖片 + 提示詞生成新的改造圖片,這在

    2024年02月05日
    瀏覽(21)
  • 全網(wǎng)最全stable diffusion圖生圖教程?。。⌒“妆厥詹兀。。。? decoding=

    全網(wǎng)最全stable diffusion圖生圖教程?。?!小白必收藏!?。?!

    手把手教你入門繪圖超強的AI繪畫程序Stable Diffusion,用戶只需要輸入一段圖片的文字描述,即可生成精美的繪畫。給大家?guī)砹巳耂table Diffusion保姆級教程資料包(文末可獲取) 1.1 傳統(tǒng)意義上的喂參考圖 我們都知道,模型在運算時是根據(jù)我們提供的提示內(nèi)容來確定繪圖方向

    2024年01月16日
    瀏覽(29)
  • 【Stable Diffusion】入門-03:圖生圖基本步驟+參數(shù)解讀

    【Stable Diffusion】入門-03:圖生圖基本步驟+參數(shù)解讀

    當提示詞不足以表達你的想法,或者你希望以一個更為簡單清晰的方式傳遞一些要求的時候,可以給AI輸入一張圖片,此時圖片和文字是相當?shù)?,都是作為一種信息輸送給模型,讓它拿來生成一張新的圖片。模型可以從圖片上獲取更多的信息,原本的圖片上記錄的像素信息會

    2024年03月20日
    瀏覽(33)
  • Stable Diffusion(SD)核心基礎知識——(文生圖、圖生圖)

    Stable Diffusion(SD)核心基礎知識——(文生圖、圖生圖)

    Stable Diffusion是計算機視覺領域的一個生成式大模型,可以用于文生圖,圖生圖,圖像inpainting,ControlNet控制生成,圖像超分等豐富的任務。 文生圖(txt2img) 文生圖任務是指將一段文本輸入到SD模型中,經(jīng)過一定的迭代次數(shù),SD模型輸出一張符合輸入文本描述的圖片。 步驟一

    2024年01月22日
    瀏覽(79)
  • 【stable diffusion】保姆級入門課程03-Stable diffusion(SD)圖生圖-涂鴉(繪圖)的用法

    【stable diffusion】保姆級入門課程03-Stable diffusion(SD)圖生圖-涂鴉(繪圖)的用法

    目錄 ?? 0.本章素材 1.涂鴉有什么用 2.涂鴉的使用場景是什么 3.操作面板 4.提示詞與涂鴉 5.涂鴉與重繪幅度 6.涂鴉的其他用法(自由創(chuàng)作) 7.課后訓練 涂鴉(繪圖)和圖生圖一樣,都會基于重繪幅度改變整張圖片的整張畫風,構圖,姿勢 等,這點是需要同學們注意的 涂鴉就是用畫筆

    2024年02月16日
    瀏覽(21)
  • Stable Diffusion學習指南【模型篇】

    Stable Diffusion學習指南【模型篇】

    模型作為機器學習后的結晶,可以說是對繪圖畫面影響最大的因素之一,一款好的模型即使不寫提示詞,出的圖都會比絞盡腦汁編寫咒語出的圖更精美。但當我們興致勃勃的下載了一堆模型后,往往會被一堆看不懂的文件后綴給亂花了眼,為什么模型要劃分這么多類型、不同

    2024年02月01日
    瀏覽(33)
  • 【stable diffusion】保姆級入門課程04-Stable diffusion(SD)圖生圖-局部重繪的用法

    【stable diffusion】保姆級入門課程04-Stable diffusion(SD)圖生圖-局部重繪的用法

    目錄 0.本章素材 1.什么是局部重繪 2.局部重繪和涂鴉有什么不同 3.操作界面講解 3.1.蒙版模糊 3.2.蒙版模式 3.3.蒙版蒙住的內(nèi)容 3.4.重繪區(qū)域 4.局部重繪的應用(面部修復) 5.課后訓練 局部重繪是不改變整體圖片的構圖的情況下,對圖片的某個區(qū)域進行重繪,局部重繪是利用蒙

    2024年02月16日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包