參考各文章以及個人操作后的記錄文章,也希望能幫助有需要的人~
首先進去大概是這樣的,介紹下下圖幾個區(qū)域(主要是文生圖)。
一、模型區(qū)域
Stable Diffusion checkpoint
下拉選擇框是用來切換ckpt模型,不清楚的可以看下這篇Stable Diffusion-webUI ckpt模型、lora模型的區(qū)別和使用SD VAE
是variable autoencoder
的意思,在這里可以選擇載入vae組分。使用vae組分可以讓圖片的色彩變得更好。
二、功能選項區(qū)域
簡單介紹下各選項卡的功能
名稱 | 作用 |
---|---|
txt2img 文生圖 | 用文字生成圖片 |
img2img 圖生圖 | 用圖片生成圖片 |
extras 附加 | 用于優(yōu)化圖像,提高圖片精度 |
PNG info 圖片信息 | 用于查看 SD所生成的 圖片的圖像信息(別人發(fā)了好看的圖片,沒有標簽,拿過來可以顯示) |
Checkpoint Merger 模型合并 | 合并不同的模型,生成新的模型 |
Train 訓練 | 訓練模型 |
Settings 設置 | 設置頁面 |
Extensions 擴展 | 擴展/插件管理 |
三、文生圖標簽區(qū)域
先分享大家一個好東西 :咒語生成器
提示詞 Prompt(正向)
提示詞 大佬的文章寫的很清楚 : 秋風于渭水
支持的語言
支持的輸入語言為英語,SD支持用自然語言描述,不過還是推薦使用用逗號分隔的一個個的關鍵詞來寫,當然表情符號,emoji,甚至一些日語都是可以用的。
tag語法
-
分隔:不同的關鍵詞tag之間,需要使用英文逗號,分隔,逗號前后有空格或者換行是不礙事的
ex:1girl,loli,long hair,low twintails
(1個女孩,loli,長發(fā),低雙馬尾) -
混合:WebUi 使用 | 分隔多個關鍵詞,實現(xiàn)混合多個要素,注意混合是同等比例混合,同時混。
ex:1girl,red|blue hair, long hair
(1個女孩,紅色與藍色頭發(fā)混合,長發(fā)) -
增強/減弱:有兩種寫法
-
第一種 (提示詞:權重數(shù)值):數(shù)值從0.1~100,默認狀態(tài)是1,低于1就是減弱,大于1就是加強
ex: ,(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)
-
第二種 (((提示詞))),每套一層()括號增強1.1倍,每套一層[]減弱1.1倍。也就是套兩層是1.1*1.1=1.21倍,套三層是1.331倍,套4層是1.4641倍。
ex:((loli)),((one girl)),(cat ears),[flower hairpin]
和第一種寫法等價 -
所以還是建議使用第一種方式,因為清晰而準確
-
-
漸變:比較簡單的理解時,先按某種關鍵詞生成,然后再此基礎上向某個方向變化。
[關鍵詞1:關鍵詞2:數(shù)字],數(shù)字大于1理解為第X步前為關鍵詞1,第X步后變成關鍵詞2,數(shù)字小于1理解為總步數(shù)的百分之X前為關鍵詞1,之后變成關鍵詞2- ex:
a girl with very long [white:yellow:16] hair
等價為
開始a girl with very long white hair
16步之后a girl with very long yellow hair
- ex:
a girl with very long [white:yellow:0.5] hair
等價為
開始a girl with very long white hair
50%步之后a girl with very long yellow hair
- ex:
-
交替:輪流使用關鍵詞
ex:[cow|horse] in a field
比如這就是個牛馬的混合物,如果你寫的更長比如[cow|horse|cat|dog] in a field
就是先朝著像牛努力,再朝著像馬努力,再向著貓努力,再向著狗努力,再向著馬努力
tag書寫示例
建議按類似這樣的格式書寫提示詞
畫質(zhì)詞>>
這個一般比較固定,無非是,杰作,最高畫質(zhì),分辨率超級大之類的
風格詞藝術風格詞>>
比如是照片還是插畫還是動畫
圖片的主題>>
比如這個畫的主體是一個女孩,還是一只貓,是兒童還是蘿莉還是少女,是貓娘還是犬娘還是福瑞,是白領還是學生
他們的外表>>
注意整體和細節(jié)都是從上到下描述,比如
發(fā)型(呆毛,耳后有頭發(fā),蓋住眼睛的劉海,低雙馬尾,大波浪卷發(fā)),
發(fā)色(頂發(fā)金色,末端挑染彩色),
衣服(長裙,蕾絲邊,低胸,半透明,內(nèi)穿藍色胸罩,藍色內(nèi)褲,半長袖,過膝襪,室內(nèi)鞋),
頭部(貓耳,紅色眼睛),
頸部(項鏈),
手臂(露肩),
胸部(貧乳),
腹部(可看到肚臍),
屁股(駱駝恥),
腿部(長腿),
腳步(裸足)
他們的情緒>>
表述表情
他們的姿勢>>
基礎動作(站,坐,跑,走,蹲,趴,跪),
頭動作(歪頭,仰頭,低頭),
手動作(手在攏頭發(fā),放在胸前 ,舉手),
腰動作(彎腰,跨坐,鴨子坐,鞠躬),
腿動作(交叉站,二郎腿,M形開腿,盤腿,跪坐),
復合動作(戰(zhàn)斗姿態(tài),JOJO立,背對背站,脫衣服)
圖片的背景>>
室內(nèi),室外,樹林,沙灘,星空下,太陽下,天氣如何
雜項>>
比如NSFW,眼睛描繪詳細
16 /9 =x / 512
將不同的分類的詞,通過換行區(qū)分開,方便自己隨時調(diào)整
(masterpiece:1.331), best quality,
illustration,
(1girl),
(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),
beautiful detailed eyes,purple|red eyes),
expressionless,
sitting,
dark background, moonlight, ,flower_petals,city,full_moon,
我跑的圖是這樣的
tag書寫要點
- 雖然大家都管這個叫釋放魔法,但真不是越長的魔咒(提示詞)生成的圖片越厲害,請盡量將關鍵詞控制在75個(100個)以內(nèi)。
- 越關鍵的詞,越往前放。
- 相似的同類,放在一起。
- 只寫必要的關鍵詞。
反向提示詞 Negative prompt
用文字描述你不想在圖像中出現(xiàn)的東西
AI大致做法就是
- 對圖片進行去噪處理,使其看起來更像你的提示詞。
- 對圖片進行去噪處理,使其看起來更像你的反向提示詞(無條件條件)。
- 觀察這兩者之間的差異,并利用它來產(chǎn)生一組對噪聲圖片的改變
- 嘗試將最終結果移向前者而遠離后者
- 一個相對比較通用的負面提示詞設置:
lowres,bad anatomy,bad hands,text,error,missing fingers,
extra digit,fewer digits,cropped,worst quality,
low quality,normal quality,jpeg artifacts,signature,
watermark,username,blurry,missing arms,long neck,
Humpbacked,missing limb,too many fingers,
mutated,poorly drawn,out of frame,bad hands,
unclear eyes,poorly drawn,cloned face,bad face
四、文生圖操作區(qū)域
1. Generate按鈕就是點擊后根據(jù)你的tag生成圖片
2.圖標1:讀取上一張圖的參數(shù)信息,點擊后會顯示你上一張生成圖的tag以及各種參數(shù)
3.圖標2:清空描述語
4.圖標3: 彈出選擇模型
前兩個選擇模型(嵌入式、超網(wǎng)絡)不常用到
后兩個為常用的ckpt模型和lora模型
Stable Diffusion-webUI ckpt模型、lora模型的區(qū)別和使用
如何設置模型封面?
方法一:用當前模型跑一張圖,然后點擊替換預覽圖
方法二:在模型文件夾放置一張和模型同名的png文件
視圖預覽有點大,怎么縮小?
打開設置,選擇左側附加網(wǎng)絡,下拉框選擇第二個,點擊apply setings,重啟webUI 刷新頁面
ok,視圖變小了
5.圖標4、圖標5 這兩個圖標都是用來設置‘‘預設/模板’’的
eg:先在左側設置一些通用的標簽,點擊“圖標5”
完事后下面的下拉框會出現(xiàn)剛剛設置的模板
后面我們在寫tag時生成圖片后就會自動置入選擇的模板
點擊“圖標4”將模板內(nèi)容置入左側描述框(就算沒有點擊圖標4置入,只要在下拉框選擇了相應模板,生成圖片時候就會自動生效)
怎么管理模板?
在 sd 的根目錄找到 styles.csv 用 記事本 打開 可以修改刪除模板,不要用excel
五、文生圖參數(shù)區(qū)域
1、采樣方法 Sampling method
選擇采樣器方法,大佬做了很詳細的描述,stable diffusion webui如何工作以及采樣方法的對比
采樣器方法太多了,如何隱藏?
找到設置,采樣器參數(shù),第一列勾選隱藏
常用的:
- Euler a :富有創(chuàng)造力,不同步數(shù)可以生產(chǎn)出不同的圖片。 超過30~40步基本就沒什么增益了。
- Euler:最最常見基礎的算法,最簡單的,也是最快的。
- DDIM:收斂快,一般20步就差不多了。
- LMS:eular的延伸算法,相對更穩(wěn)定一點,30步就比較穩(wěn)定了
- PLMS:再改進一點LMS
- DPM2:DDIM的一種改進版,它的速度大約是 DDIM 的兩倍
2、采樣步數(shù) Sampling steps
一般默認20步就可以了
秋風于渭水 文章描述:
AI繪畫的原理用人話說就是,先隨機出一個噪聲圖片
然后一步步的調(diào)整圖片,向你的 提示詞 Prompt 靠攏
Sampling Steps就是告訴AI,這樣的步驟應該進行多少次。
步驟越多,每一步移動也就越小越精確。同時也成比例增加生成圖像所需要的時間。
大部分采樣器超過50步后意義就不大了
下圖是同一個圖從1step到20step,不同step時圖像的變化
3、Restore faces 面部修復
對生成圖片任務面部進行修復, 對真人效果好,二次元作用不大,很占顯存
4、Tiling 平鋪/分塊
生成可以往左右上下連續(xù)拼接的圖像
5、Hires. fix 高清修復
將你的圖片尺寸 ,按照你置頂?shù)姆糯蟊堵剩匦吕L制圖片內(nèi)容
放大算法:不知道選什么就選“ESRGAN_4x ”
高清修復采樣次數(shù): 20 就行
重繪幅度:大后修改細節(jié)的程度,從0到1,數(shù)值越大,AI創(chuàng)意就越多,也就越偏離原圖, 0.5~0.7就行
放大倍率:看你自己顯卡能力了
6、寬&高
單位是像素,適當增加尺寸,AI會試圖填充更多的細節(jié)進來。
非常小的尺寸(低于256X256),會讓AI沒地方發(fā)揮,會導致圖像質(zhì)量下降。
非常高的尺寸(大于1024X1024),會讓AI亂發(fā)揮,會導致圖像質(zhì)量下降。
增加尺寸需要更大的顯存。4GB顯存最大應該是1280X1280(極限)
7、Batch count 生成批次
同樣的配置,循環(huán)跑的次數(shù)
8、Batch size每批數(shù)量
每跑一次,生成幾張圖
9、 CFG Scale 提示詞相關性
圖像與提示詞的匹配程度。一般在5~15之間為好,7,9,12是3個常見的設置值。
10、Seed 隨機種子
圖片的DNA,-1是隨機
保持種子不變,相同的模型和參數(shù)大概率出現(xiàn)相同的圖像
不同型號的顯卡即使參數(shù)與模型完全一致,也可能會生成完全不同的圖
- 圖標1(骰子):隨機種子-1
- 圖標2(綠色箭頭):自動填寫最近生成的圖片的種子值
- EXtra(額外的)選擇后會出現(xiàn)
Variation seed(差異隨機種子)
可以是-1,也可以是一個固定的種子
Variation strength(差異強度)
越強越接近差異隨機種子,越弱越偏向隨機種子
eg:我生成了一個賊好看的圖片,我想生成和這張相似的其他圖片
差異種子固定(你覺得好看的那張圖的隨機種子),差異隨機種子-1,差異強度低一點,就能生成一系列相似圖片
eg:我生成(同tag參數(shù))了兩張都很好看的圖片,我想生成和這兩張差不多的圖片
差異種子固定(你覺得好看的那張圖的隨機種子),差異隨機種子固定(你覺得另一張好看的那張圖的隨機種子),差異強度適中,就能生成一系列介于兩張圖片之間的圖片文章來源:http://www.zghlxwxcb.cn/news/detail-454493.html
六、文生圖出圖區(qū)域
圖片點擊可以預覽
1、打開圖片存儲的文件夾
2、點擊后可以下載該圖片
3、點擊后下載打包的圖片
4、5、6、將該圖片移動到對應的操作區(qū)域文章來源地址http://www.zghlxwxcb.cn/news/detail-454493.html
到了這里,關于stable diffusion webui 使用的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!