一、前言
Midjourney 生成的圖片很難精準的控制,隨機性很高,需要大量的跑圖,但Stable Diffusion可以根據(jù)模型較精準的控制。
SD 效果圖展示:
二、Stable Diffusion 介紹
Stable Diffusion 是一款基于人工智能技術(shù)開發(fā)的繪畫軟件,它可以幫助藝術(shù)家和設(shè)計師快速創(chuàng)建高品質(zhì)的數(shù)字藝術(shù)作品。該軟件使用了一種稱為 GAN(生成對抗網(wǎng)絡(luò))的深度學習模型,該模型可以學習并模仿藝術(shù)家的創(chuàng)作風格,從而生成類似的藝術(shù)作品。
Stable Diffusion 具有直觀的用戶界面,可以讓用戶輕松地調(diào)整繪畫參數(shù)并實時預覽結(jié)果。用戶可以選擇不同的畫布、畫筆和顏色,還可以通過調(diào)整圖像的風格、紋理和顏色等參數(shù)來創(chuàng)建各種不同的藝術(shù)作品。
除此之外,Stable Diffusion 還提供了一些高級功能,例如批量處理、自動矯正和自動化調(diào)整等,可以幫助用戶更加高效地完成大量的繪畫任務。
總之,Stable Diffusion 是一款功能強大的 AI 繪畫軟件,它比現(xiàn)在市面上主流的 AI 繪畫軟件 Midjourney 更加的強大,可以說 SD 是所有 AI 繪畫的鼻祖級存在,同樣,更強大代表著它的上手難度及配置要求也更高。那么說到這里,我們就來看看這兩款軟件的一個對比吧
三、主流 AI 繪畫軟件的對比
四、Stable Diffusion 電腦配置要求
1. 配置要求:
需要使用 N 卡(NVIDIA 顯卡),顯卡的顯存至少需要 4GB 以上顯存才能在本地運行。最低配置需要 4GB 顯存,基本配置 6GB 顯存,推薦配置 12GB 顯存或者以上。
Stable Diffusion Ai 繪畫主要是運行顯卡,算力越強,出圖越快。顯存越大,所設(shè)置圖片的分辨率越高)
“推薦使用 RTX4090 顯卡哦” -----來自一個 3080 顯卡玩家
還有一點的就是硬盤空間要大,SD 出圖主要依賴模型,網(wǎng)上下載的模型資源一般都很大(一個模型在 2G 以上)批量跑圖也是很占內(nèi)存的,這邊建議 60GB 以上的硬盤空間。
2. 網(wǎng)絡(luò)要求: 大家都懂哈,咱也不說。
3. 操作系統(tǒng): 需要是 Win10 或 Win11。
滿足以上條件基本上就可以用 SD 跑圖啦。
五、Stable Diffusion 安裝
SD 的安裝我們就不要整的很復雜了,直接用大佬制作的一鍵安裝/啟動包就行,我們把時間用在刀刃上。
自己手動安裝需要上 Github 下載文件,還要下載 Ptthon 等工具,一般第一次手動安裝會出現(xiàn)各種奇怪的報錯,總之很復雜,我之前自己安裝過,真就花了一上午都還沒安裝好。所以我不建議也不教大家手動安裝了。(如果你要硬上,可以在網(wǎng)上看看別的使用教程)
上黑科技?。?!咱直接去使用@秋葉 aaaki 大佬的免費啟動器和安裝包。
我們下載這兩個文件,下載鏈接在這文章頂部,可點擊跳轉(zhuǎn)過去下載
注意:下載的文件一定要放在空間比較大的盤里。
來看下具體操作:
- 1. 安裝一下這個“啟動器運行依賴”。
- 2. 然后把這兩個文件復制一下,我們需要粘貼到“webui:文件夾中
- 3. 粘貼替換目標中的文件。粘貼的位置看我的文件夾路徑。
- 4. 這里我重新走一遍打開流程,以防大家退出去了不知道從哪里進。我們打開下載的文件夾,然后進入到“novelai-webui”文件夾
- 5. 打開“novelai-webui-aki-v3”文件夾。
- 6. 然后下拉下拉…找到這個啟動器,雙擊就完事了,這個就是我們剛剛粘貼替換的文件。
- 7. 然后就打開啦,一鍵啟動就好了。
六、Stable Diffusion 基礎(chǔ)操作
1. 大模型的切換
首先是這個界面左上角,在這里可以切換你所安裝的模型。
這里我先推薦一下我常用的模型網(wǎng)站:C 站: civitai.com/
然后我們在 C 站上下載一些模型:
接下來就是安裝了,很簡單,把下載的模型放到這個路徑文件夾中。然后刷新 web UI 界面(就是 SD 操作界面)
2. 模型的 VAE(Sd 的 VAE)
VAE 的全稱是 Variational Auto-Encoder,翻譯過來是變分自動編碼器,本質(zhì)上是一種訓練模型,Stable Diffusion 里的 VAE 主要是模型作者將訓練好的模型“解壓”的解碼工具。
這里可以切換 VAE。一般情況下我們就選擇第一個自動就行了。
在 C 站下載模型,在下載頁面會有文件顯示,如圖。
VAE 的安裝路徑看我這里,把下載的文件復制粘貼,然后把 web UI 界面刷新一下(就是 SD 操作界面)
總結(jié):
- 總的來說就是你在 C 站上下載的模型有些內(nèi)置就有 VAE 的屬性(不需要下載 VAE 文件),有些沒有內(nèi)置下載的時候我們就把 VAE 文件下載。(VAE 文件一般大小在幾百兆左右)
- VAE 的作用就是沒有加載 VAE 的圖片是灰灰的,加載之后就是會產(chǎn)生一個潤色的效果,色彩更加豐富。
3. 功能選項
這里我挑選幾個重要的功能講解下。
文生圖,這里與 Midjourney 不同的是,SD 有一個反向關(guān)鍵詞(意思是不要圖片出現(xiàn)什么),文生圖的關(guān)鍵詞格式與 Midjourney 基本一致
下面這塊參數(shù)就是設(shè)置圖片的一些基本參數(shù),分辨率、尺寸等等,具體參數(shù)見下文。
圖生圖,這個也很好理解,放參考圖然后輸入提示詞,與其他 AI 繪畫軟件一致。
圖片信息,意思是你用 SD 畫的圖,放在這里來,右邊會顯示這個圖片的一些參數(shù),包括關(guān)鍵詞。
然后你可以選擇右下角的一些功能,比如“文生圖”。
模型合并,這個功能很厲害,后面我出一篇關(guān)于這個功能的教學,大致就是把多個模型混合起來。
訓練,這個就是訓練自己的模型,新手用的比較少,后面可用作工作流的部署。(這個才是我推薦的核心哦)
設(shè)置
擴展
4. 提示詞和反向提示詞
提示:
提示詞內(nèi)輸入的東西就是你想要畫的東西,反向提示詞內(nèi)輸入的就是你不想要畫的東西。
提示框內(nèi)只能輸入英文,所有符號都要使用英文半角,詞語之間使用半角逗號隔開。
一般來說越靠前的詞匯權(quán)重就會越高,比如我這張圖的提示詞:
The personification of the Halloween holiday in the form of a cute girl with short hair and a villain’s smile, (((cute girl)))cute hats, cute cheeks, unreal engine, highly detailed, artgerm digital illustration, woo tooth, studio ghibli, deviantart, sharp focus, artstation, by Alexei Vinogradov bakery, sweets, emerald eyes。
萬圣節(jié)假期的擬人化形式是一個留著短發(fā)和惡棍笑容的可愛女孩,可愛的帽子,可愛的臉頰,虛幻的引擎,高度詳細,藝術(shù)種子數(shù)字插圖,woo tooth,吉卜力工作室,deviantart,銳利的焦點,artstation,由 Alexei Vinogradov 面包店,糖果,綠寶石般的眼睛。
第一句關(guān)鍵詞詞組:萬圣節(jié)假期的擬人化形式是一個留著短發(fā)和惡棍笑容的可愛女孩。那生成的圖片主體畫面就會是萬圣節(jié)短發(fā)可愛笑容女孩
這里可能有用過 Midjourney 的小伙伴們就有疑問了,(((cute girl)))是什么意思,為啥有這么多括號,我來為大家解答下,這個是權(quán)重調(diào)節(jié),類似 Midjourney 的 ::
① 最直接的權(quán)重調(diào)節(jié)就是調(diào)整詞語順序,越靠前權(quán)重越大,越靠后權(quán)重越低,上面說過。
② 可以通過下面的語法來對關(guān)鍵詞設(shè)置權(quán)重,一般權(quán)重設(shè)置在 0.5~2 之間,可以通過選中詞匯,按 ctrl+↑↓來快速調(diào)節(jié)權(quán)重,每次調(diào)節(jié)為0.1,也可以直接輸入。
③ 加英文輸入的(),一個括號代表這組關(guān)鍵詞的權(quán)重是 1.1,兩個括號是 1.1*1.1 的權(quán)重,不要加太多了哈??梢越Y(jié)合第二點固定權(quán)重,比如(((cute girl:1.2))),那這個關(guān)鍵詞的權(quán)重就很高了。
5. 功能按鈕
我們來介紹下右邊這幾個功能,生成就不說了,輸入關(guān)鍵詞生成就跑圖了。
第一按鈕的意思是讀取你上一張圖的所有參數(shù)信息(包括關(guān)鍵詞),比如你畫一張圖之后,關(guān)掉了軟件,再次啟動點擊這個就會把參數(shù)復制進來。
第二個按鈕就是刪除了,清空關(guān)鍵詞;這里可以和第一個按鈕結(jié)合用哦
第三個按鈕就是模型選擇管理
這個按鈕就是點擊就會出現(xiàn)這些功能,你安裝的模型和 Lora 都可以在這邊調(diào)整。
小知識:這里可以把你生成的圖片添加到模型的封面上,方便你后面看這個模型的效果,看我怎么做:
找到這個模型的名稱,然后我這里是跑出來一張圖片的,點擊這個按鈕(lora 一樣)
最終效果:
后面兩個就是一個提示詞模板功能:
我們可以先點最后一個按鈕,把現(xiàn)在的關(guān)鍵詞創(chuàng)建一下,取個名字
然后在模板風格這里選中我們剛剛創(chuàng)建的模板(可以多選)
選中之后按一下第四個按鈕,我們創(chuàng)建的關(guān)鍵詞就被填入進去了,這塊收工!
6. 采樣步數(shù)
一般來說大部分時候采樣部署只需要保持在 20~30 之間即可,更低的采樣部署可能會導致圖片沒有計算完全,更高的采樣步數(shù)的細節(jié)收益也并不高,只有非常微弱的證據(jù)表明高步數(shù)可以小概率修復肢體錯誤,所以只有想要出一張窮盡細節(jié)可能的圖的時候才會使用更高的步數(shù)。(加大這個會導致出圖變慢)
7. 采樣方法
Stable diffusion webui 是 Stable diffusion 的 GUI 是將 stable diffusion 實現(xiàn)可視化的圖像用戶操作界面,它本身還集成了很多其它有用的擴展腳本。
SD 的采樣方法有很多,大家有興趣了解的可以去知乎看看@劉登宇的一篇文章《stable diffusion webui 如何工作以及采樣方法的對比》。這里我們只介紹兩個種常用的。
這里的采用方式有很多,但是我們常用的就那幾個,我們可以去設(shè)置里面把不需要用到的關(guān)掉,不展示在這個界面中。然后點擊右邊的重啟 UI 就好了。
8. 高清修復和圖片尺寸參數(shù)
前面兩個做個簡單的介紹,面部修復對寫實的風格有點效果,可平鋪就不要用了,生成的圖片很奇怪,可以自己試試。
我們說說高清修復,高清修復的意思是把基礎(chǔ)生成的圖片,按照你選擇放大的倍率放大到指定分辨率之后再重新繪制圖片,受到你重復幅度調(diào)節(jié)的數(shù)值影響。
寬度、高度就是圖片的長寬比,很容易理解,生成批次和數(shù)量就是幾批,一批幾張圖,配置好的可以直接拉滿,增加效率哦。
提示詞相關(guān)性:圖像與你的提示的匹配程度。增加這個值將導致圖像更接近你的提示(根據(jù)模型),但它也在一定程度上降低了圖像質(zhì)量。可以用更多的采樣步驟來抵消。
默認未選中高清修復是這樣的,當前圖片的參數(shù)。
9. 隨機種子(seed)
這個功能與 Midjourney 的 Seed 功能一樣。
隨機數(shù)的起點。保持這個值不變,可以多次生成相同(或幾乎相同,如果啟用了 xformers)的圖像。沒有什么種子天生就比其他的好,但如果你只是稍微改變你的輸入?yún)?shù),以前產(chǎn)生好結(jié)果的種子很可能仍然會產(chǎn)生好結(jié)果。
輸入不同的種子,生成的圖片不一樣,seed 值一樣,那生成的圖片也是一樣。
差異隨機種子,需要勾選這個按鈕:
這個功能是固定一個種子,然后調(diào)整差異強度來生成圖片,因為是固定的 seed 值,所以生成的圖風格都是類似的。
這邊的幾個功能都很簡單,大家嘗試下就能理解了,那基礎(chǔ)操作我們就先講到這里,大家趕緊玩起來吧?。?/p>
寫在最后
感興趣的小伙伴,贈送全套AIGC學習資料,包含AI繪畫、AI人工智能等前沿科技教程和軟件工具,具體看這里。
?
AIGC技術(shù)的未來發(fā)展前景廣闊,隨著人工智能技術(shù)的不斷發(fā)展,AIGC技術(shù)也將不斷提高。未來,AIGC技術(shù)將在游戲和計算領(lǐng)域得到更廣泛的應用,使游戲和計算系統(tǒng)具有更高效、更智能、更靈活的特性。同時,AIGC技術(shù)也將與人工智能技術(shù)緊密結(jié)合,在更多的領(lǐng)域得到廣泛應用,對程序員來說影響至關(guān)重要。未來,AIGC技術(shù)將繼續(xù)得到提高,同時也將與人工智能技術(shù)緊密結(jié)合,在更多的領(lǐng)域得到廣泛應用。
?
一、AIGC所有方向的學習路線
AIGC所有方向的技術(shù)點做的整理,形成各個領(lǐng)域的知識點匯總,它的用處就在于,你可以按照下面的知識點去找對應的學習資源,保證自己學得較為全面。
二、AIGC必備工具
工具都幫大家整理好了,安裝就可直接上手!
三、最新AIGC學習筆記
當我學到一定基礎(chǔ),有自己的理解能力的時候,會去閱讀一些前輩整理的書籍或者手寫的筆記資料,這些筆記詳細記載了他們對一些技術(shù)點的理解,這些理解是比較獨到,可以學到不一樣的思路。
四、AIGC視頻教程合集
觀看全面零基礎(chǔ)學習視頻,看視頻學習是最快捷也是最有效果的方式,跟著視頻中老師的思路,從基礎(chǔ)到深入,還是很容易入門的。
五、實戰(zhàn)案例文章來源:http://www.zghlxwxcb.cn/news/detail-838263.html
紙上得來終覺淺,要學會跟著視頻一起敲,要動手實操,才能將自己的所學運用到實際當中去,這時候可以搞點實戰(zhàn)案例來學習。
?文章來源地址http://www.zghlxwxcb.cn/news/detail-838263.html
到了這里,關(guān)于stable diffusion 零基礎(chǔ)入門教程的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!