大家好,我是風(fēng)雨無阻。
通過前面幾篇AI 繪畫Stable Diffusion 研究系列的介紹,我們完成了Stable Diffusion整合包的安裝、模型ControlNet1.1 安裝、模型種類介紹與安裝,相信看過教程的朋友們,手上已經(jīng)有可以操作實踐的Stable Diffusion 環(huán)境了。
那么本篇文章將給大家?guī)?Stable Diffusion 最重要也是使用最多的文生圖功能介紹,由于內(nèi)容比較多,這里會分成上、下兩篇文章進行介紹。
今天為大家?guī)淼氖?AI 繪畫Stable Diffusion 研究(四)sd文生圖功能詳解(上)。
大家進入到web ui 頁面后,首先看到的是下面這個界面。
上圖一目了然的標(biāo)注了文生圖界面大致的功能。
接下來,就詳細(xì)講解一下每個功能的使用方法和注意事項。
1、模型選擇區(qū)域
模型對于 SD 繪圖來說非常重要,不同的模型類型、質(zhì)量會很大程度的決定最終的出圖效果。
2、功能欄
包括了常見的 文生圖、圖生圖、后期處理等常用功能。不同的功能頁面也不同,在這里,我們先針對經(jīng)常使用的文生圖模塊頁面來進行講解。
3、正向提示詞
正向提示詞prompt &tag**: 如果大家使用過 ChatGPT 就應(yīng)該知道 Prompt 是什么。說的直白點就是我們想讓 SD 幫忙生成什么樣的圖的描述,比如角色或場景等,**需要使用英文進行描述
正向Prompt &Tag 改善畫質(zhì)用的 Tag ,適用于二次元風(fēng)格,可以考慮搭配不同的模型使用:
(masterpiece:1.2), best quality, masterpiece, highres, original, extremely detailed wallpaper.oerfect lighting,(extremely detailed CG:1.2), drawing, paintbrush
4、反向提示詞
反向提示詞 Prompt&Tag : 就是告訴SD 生成圖里 ,不想出現(xiàn)的內(nèi)容, 需要使用英文進行描述。
通用反面 Tag,保底不出古神用的 Tag,適用于二次元風(fēng)格,可以考慮搭配不同的模型使用:
NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality,(monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331),duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:l.331), mutated hands, (poorly drawnands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331),missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051),unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers.((extra arms and legs)))
5、生成按鈕
調(diào)整完其他設(shè)置后,點擊生成,開始生成圖片,也可以不做調(diào)整。
6、采樣迭代步數(shù)
AI 繪畫的過程是將純噪點圖,變?yōu)楦咔鍒D的一個過程,采樣迭代步數(shù),就是這個過程需要的步數(shù),隨著步數(shù)的增加,圖片的細(xì)節(jié)也不斷增多。
采樣迭代步數(shù)不能設(shè)置太小,也不能設(shè)置太大。設(shè)置太小,圖片效果就不好;設(shè)置太大, 生成圖花的時間就越長,如果超過40 步以后,那么畫面的變化是基本看不出來。
采樣迭代步數(shù),推薦 20-30 之間,通常28是一個不錯的值。
7、采樣方法
采用什么樣的繪畫方式算法,以及“畫多少筆” 來繪圖,一定程度上決定出圖的質(zhì)量。
以下是 每個采樣方法,對應(yīng)生成步數(shù)的效果。
如圖:
綜合以上參考,根據(jù)出圖質(zhì)量、采樣步數(shù)的對比,對于新手朋友來說 推薦無腦使用:DPM adaptive 采樣方法。
8、出圖顯示區(qū)域
9、出圖大小
出圖大小 :默認(rèn) 512**512 像素 ,因為模型訓(xùn)練時,都是使用這個尺寸,因此效果最好,所以一般保持默認(rèn)即可,當(dāng)然如果要出 3:2 的圖,也可以設(shè)置為: 512* 768 , 768*512 。
根據(jù)自己的需要進行調(diào)整,也可以不用調(diào)整。出圖越大,對于顯卡要求越高。
10、出圖數(shù)量
出圖數(shù)量=總批次數(shù)x每批數(shù)量。
每批的數(shù)量越多:需要的顯存越大。
總批次越多:根據(jù)實際經(jīng)驗,生成的圖片質(zhì)量要好一些,但是花的時間越長。
可根據(jù)自己的需求和電腦配置進行選擇。
11、出圖存儲目錄
可以查找歷史出圖
12、隨機種子
模仿別人的圖,需要進行調(diào)整,一般不用調(diào)整。
13、面部修復(fù)
面部修復(fù),首先需要在設(shè)置中,按如下選項進行設(shè)置 :
然后依次點擊:保存設(shè)置,重載前端,讓其生效:
14、高分辨率修復(fù)
因為我們出圖是512*512, 如果要放大,比如1024x1024 ,就需要勾選高分辨率修復(fù)功能。
A、放大算法選擇推薦
真實風(fēng)格推薦選擇:R-ESRGAN 4x+
動漫風(fēng)格推薦選擇:R-ESRGAN 4x+ Anim
B、放大倍數(shù)
根據(jù)電腦配置進行選擇
顯卡顯存高 選擇 2-3倍
顯卡顯存不高,選擇1.5-2倍
15、提示詞引導(dǎo)系數(shù)(CFD Scale):
提示詞引導(dǎo)系數(shù),是控制提示詞與生成的圖像相關(guān)性 ,可以理解為 “越小AI越自由發(fā)揮” ,一般推薦數(shù)值為5-15之間,默認(rèn)為 7 。
如果數(shù)值太大,會出現(xiàn)銳化、線條變粗的效果;
如果太小AI就自由發(fā)揮了,不看 Tag, 同時圖像的飽和度也會偏低。
參考以下對比圖:
16、隨機種子:
隨機種子是生成過程中所有隨機性的源頭, 每個種子都是一幅不一樣的畫。
默認(rèn)的 -1 是代表每次都換一個隨機種子,生成的每張圖就不同。由隨機種子,生成了隨機的噪聲圖,再交給AI進行畫出來。
使用固定的隨機種子 ,可控制生成圖與之前的圖更相似。
17、保存
針對部署到本地的,意義不大。
如果針對部署到服務(wù)器上的,點擊保存后,就可以下載。
18、打包下載
生成多張圖的時候,圖片會打包到壓縮包內(nèi),就可以下載,本地基本用不到。
19、發(fā)送到圖生圖、發(fā)送到重繪、發(fā)送到后期處理,這三個功能,這里就先不做介紹。后邊介紹圖生圖功能的時候再做詳細(xì)說明。
20、圖標(biāo)功能介紹
圖標(biāo)1: 箭頭 從提示詞或上次生成的圖片中,讀取生成參數(shù)。
圖標(biāo)2: 清空提示詞
圖標(biāo)3: 快捷顯示隱藏擴展模型
圖標(biāo)4: 預(yù)設(shè)樣式,保存反向提示詞。
21、Tag 加權(quán)、減權(quán)用法簡單說明
大家可能會經(jīng)常看到別人發(fā)的 Tag 里面會有一些符號?比如大小括號等等。這些屬于進階用法,這里僅僅簡單提及一下。
這里以 Tree 這個 Tag 作為例子進行說明。
(Tree) : 加權(quán)重,這是1.1倍。
((Tree)) :括號疊加,這是 1.1*1.1=1.21倍。
[Tree] :減權(quán)重,一般用的少。減權(quán)重也一般就用下面的指定倍數(shù)。
(Tree:1.5) 指定倍數(shù),這里是1.5倍的權(quán)重,還可以 (Tree:0.9) 達到減權(quán)重的效果。文章來源:http://www.zghlxwxcb.cn/news/detail-656103.html
好了,今天的內(nèi)容就到這里,下一篇將給大家詳細(xì)講解提示詞的規(guī)則和寫作技巧,敬請期待!文章來源地址http://www.zghlxwxcb.cn/news/detail-656103.html
到了這里,關(guān)于AI 繪畫Stable Diffusion 研究(四)sd文生圖功能詳解(上)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!