Stable Diffuse 之 安裝文件夾、以及操作界面 UI 、Prompt相關說明
目錄
Stable Diffuse 之 安裝文件夾、以及操作界面 UI 、Prompt相關說明
一、簡單介紹
二、安裝文件相關說明
三、界面的簡單說明
四、prompt 的一些語法簡單說明
1、Prompt :正向提示詞 ,用文字描述在圖像中出現(xiàn)的內(nèi)容
2、Negative prompt:負面提示詞,用文字描述不想在圖像中出現(xiàn)的內(nèi)容
一、簡單介紹
Stable Diffusion是一個文本到圖像的潛在擴散模型,由CompVis、Stability AI和LAION的研究人員和工程師創(chuàng)建。它使用來自LAION-5B數(shù)據(jù)庫子集的512x512圖像進行訓練。使用這個模型,可以生成包括人臉在內(nèi)的任何圖像,因為有開源的預訓練模型,所以我們也可以在自己的機器上運行它,如下圖所示。
Stable Diffusion是一個AI 繪圖軟件 (開源模型),可本地部署,可切換多種模型,且新的模型和開源庫每天都在更新發(fā)布,最重要的是免費,沒有繪圖次數(shù)限制。
Github 網(wǎng)址:GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
二、安裝文件相關說明
下面進行以下文件夾進行簡單說明:
1)embeddings
2)extensions
3)models
4)outputs
1、embeddings
embeddings 放置訓練的 embedding 模型,它可以在我們使用基礎模型時,再添加此模型進行疊加效果。 網(wǎng)頁界面 UI 對應位置如圖
2、extensions
extensions 插件安裝目錄,在 WebUI 插件安裝界面安裝后,可以此文件夾中查看,并上傳相應的插件模型(如 ControlNet 需要專門的模型)。 網(wǎng)頁界面 UI 對應位置如圖
3、models
models 模型文件夾,安裝時會默認下載 v1-5-pruned-emaonly,我們從其它地方下載的模型可以拷貝到此文件夾,在需要使用某個模型時,可以進行切換, 網(wǎng)頁界面 UI 對應位置如圖
4、outputs
outputs 生成的圖系統(tǒng)會輸出到這個文件夾里,可進行查看及保存。 網(wǎng)頁界面 UI 對應位置如圖
三、界面的簡單說明
1、txt2img: 文字生成圖片
Sampling method:采樣方法
● Euler a :富有創(chuàng)造力,不同步數(shù)可以生產(chǎn)出不同的圖片。 超過 30~40 步基本就沒什么增益了
● Euler:最常見的基礎算法,最簡單也最快
● DDIM:速度快,一般 20 步差不多
● LMS:eular 的延伸算法,相對更穩(wěn)定一點,30 步就比較穩(wěn)定
● PLMS:改進一點的 LMS
● DPM2:DDIM 的一種改進版,速度大約是 DDIM 的兩倍
Sampling Steps:采樣迭代步數(shù)
先隨機出一個噪聲圖片,然后一步步調(diào)整圖片,向提示詞 Prompt 靠攏。其實就是告訴 Stable Diffusion,這樣的步驟應該進行多少次,步驟越多,每一步移動也就越小越精確,同時也成比例地增加生成圖像所需要的時間。大部分采樣器超過 50 步后意義就不大了
Restore faces:優(yōu)化面部,繪制面部圖像特別注意。原理是調(diào)用一個神經(jīng)網(wǎng)絡模型對面部進行修復
Tiling:生成一個可以平鋪的圖像
Highres. fix:先生成低分辯率的圖,接著添加細節(jié)之后再輸出,可以把低分辨率的照片調(diào)整到高分辨率
Batch count、 Batch size: 都是生成幾張圖,前者計算時間長,后者需要顯存大
Denoising strength:決定算法對圖像內(nèi)容的保留程度。因為加的噪聲少,原圖片部分多,加的噪聲多,原圖片部分少。在 0 處,什么都不會改變,而在 1 處,你會得到一個不相關的圖像
CFG Scale:對描述參數(shù)的傾向程度(也就是生成圖像與提示詞的一致程度),越低的值產(chǎn)生越有創(chuàng)意的結(jié)果,如果太低,例如 1,那 Promp t就完全沒用了。一般在 5~15 之間為好,7,9,12 是 3 個常見的設置值
Seed:種子數(shù),只要種子數(shù)、參數(shù)、模型都一致,就能重新生成一樣的圖像,-1 的話是生成一個隨機數(shù)
2、img2img: 圖片生成圖片
與 txt2img 類似,在文字提示詞的基礎上,增加了圖片提示。
Denoising strength:與原圖一致性的程度,一般大于 0.7 出來的都是新效果,小于 0.3 基本就會原圖一致
3、Extras: “無損”放大圖片,優(yōu)化(清晰、擴展)圖像
主要將圖像進行優(yōu)化,Resize 設置放大的倍率,GFPGAN visibility 主要對圖像清晰度進行優(yōu)化,CodeFormer visibility 對于老照片及人臉修復很有效,權(quán)重參數(shù)為 0 時效果最大,為 1 時效果最小,建議從 0.5 開始嘗試。
Upscaler 放大算法,一般不清楚可不選,或者選 ESRGAN_4x
Batch from Directory 可以進行批量處理,在 Input directory 中輸入需要批量處理圖片的目錄,在 Output directory 中輸入保存結(jié)果目錄。
Scale to 中,可自定義圖片的尺寸
4、PNG info:從圖片 exif 里獲取圖片的信息,如果是 Stable Diffusion 原始生成的 png 圖片,圖片的 exif 信息里會寫入圖片生成參數(shù)
5、Checkpoint Merger:合并不同的模型,生成新的模型
6、Train:訓練 embedding 或者 hypernetwork
7、Settings:設置頁面
8、Extensions:插件的安裝和管理頁面
installed 表示已經(jīng)安裝好的插件
Available 表示在線可用的插件,一般都是從這里安裝。
點擊 Load from(加載自): 加載出可用的插件,然后按 Ctrl + F,輸入想要安裝插件的名稱,以此進行查找。
install from URL 表示可以根據(jù)網(wǎng)址進行制定安裝,這里網(wǎng)址一般指的是github 倉庫地址
Backup/Restore 用來備份和恢復制定配置的
四、prompt 的一些語法簡單說明
1、Prompt :正向提示詞 ,用文字描述在圖像中出現(xiàn)的內(nèi)容
正向提示詞例子:
(masterpiece:1.331), best quality,illustration,(1girl),
(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),
beautiful detailed eyes,purple|red eyes),expressionless,sitting,dark background, moonlight,flower_petals,city,full_moon,?
分隔:不同的關鍵詞tag之間,需要使用英文逗號 , 分隔,逗號前后有空格或者換行不影響結(jié)果。例如:1girl,loli,long hair,low twintails(1 個女孩,loli,長發(fā),低雙馬尾)
混合:WebUI 使用 | 分隔多個關鍵詞,實現(xiàn)混合多個要素,注意混合是同等比例、同時混。例如:1girl,red|blue hair, long hair(1個女孩,紅色與藍色頭發(fā)混合,長發(fā))
增強/減弱:有兩種寫法。
● 第一種 (提示詞:權(quán)重數(shù)值):數(shù)值從0.1~100,默認狀態(tài)是 1,低于 1 就是減弱,大于 1 就是加強。例如:(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)
● 第二種 (((提示詞))),每套一層()括號增強 1.1 倍,每套一層 [] 減弱 1.1 倍。也就是套兩層是1.1*1.1=1.21 倍,套三層是 1.331 倍,套 4 層是 1.4641 倍。例如: ((loli)),((one girl)),(cat ears),[flower hairpin],這與第一種寫法等價,所以還是建議使用第一種方式。
漸變:可簡單的理解時為,先按某種關鍵詞生成,然后再此基礎上向某個方向變化。
[關鍵詞1:關鍵詞2:數(shù)字],數(shù)字大于 1 理解為第 X 步前為關鍵詞 1,第 X 步后變成關鍵詞 2,數(shù)字小于 1 理解為總步數(shù)的百分之 X 前為關鍵詞 1,之后變成關鍵詞 2。
例如:a girl with very long [white:yellow:16] hair 等價為開始 a girl with very long white hair
,16步之后 a girl with very long yellow hair
例如:a girl with very long [white:yellow:0.5] hair 等價為開始 a girl with very long white hair,50% 步之后 a girl with very long yellow hair
交替:輪流使用關鍵詞,例如:[cow|horse] in a field,這就是個牛與馬的混合物;[cow|horse|cat|dog] in a field 就是牛、馬、貓、狗之間混合。
2、Negative prompt:負面提示詞,用文字描述不想在圖像中出現(xiàn)的內(nèi)容
一些常見的負面提示詞:
lowres,bad anatomy,bad hands,text,error,missing fingers,
extra digit,fewer digits,cropped,worst quality,
low quality,normal quality,jpeg artifacts,signature,
watermark,username,blurry,missing arms,long neck,
Humpbacked,missing limb,too many fingers,
mutated,poorly drawn,out of frame,bad hands,
owres,unclear eyes,poorly drawn,cloned face,bad face文章來源:http://www.zghlxwxcb.cn/news/detail-705089.html
prompt 提示詞先介紹到這里,后面將會一篇單獨文章進行說明文章來源地址http://www.zghlxwxcb.cn/news/detail-705089.html
到了這里,關于Stable Diffuse 之 安裝文件夾、以及操作界面 UI 、Prompt相關說明的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!