0 寫在前面
機(jī)器學(xué)習(xí)強(qiáng)基計劃聚焦深度和廣度,加深對機(jī)器學(xué)習(xí)模型的理解與應(yīng)用?!吧睢痹谠敿?xì)推導(dǎo)算法模型背后的數(shù)學(xué)原理;“廣”在分析多個機(jī)器學(xué)習(xí)模型:決策樹、支持向量機(jī)、貝葉斯與馬爾科夫決策、強(qiáng)化學(xué)習(xí)等。
??詳情:機(jī)器學(xué)習(xí)強(qiáng)基計劃(附幾十種經(jīng)典模型源碼合集)
話不多說,先看看AI繪畫的效果
接下來帶大家體驗(yàn)一下二次元畫師novelAI
。最新進(jìn)展——AI繪畫進(jìn)軍三次元,有人用它打造賽博女友?(diffusion)
1 diffusion vs GAN
所謂擴(kuò)散算法diffusion
是指先將一幅畫面逐步加入噪點(diǎn),一直到整個畫面都變成白噪聲。記錄這個過程,然后逆轉(zhuǎn)過來給AI學(xué)習(xí)。
AI看到的是什么?一個全是噪點(diǎn)的畫面如何一點(diǎn)點(diǎn)變清晰直到變成一幅畫,AI通過學(xué)習(xí)這個逐步去噪點(diǎn)的過程來學(xué)會作畫。
diffusion
和之前大火的GAN
模型相比,有什么優(yōu)勢呢?用OpenAI的一篇論文內(nèi)容來講,用diffusion
生成的圖像質(zhì)量明顯優(yōu)于GAN
模型;而且與GAN
不同,diffusion
不用在鞍點(diǎn)問題上糾結(jié)——涉及穩(wěn)定性問題,只需要去最小化一個標(biāo)準(zhǔn)的凸交叉熵?fù)p失即可,這樣就大大簡化了模型訓(xùn)練過程中,數(shù)據(jù)處理的難度。
總結(jié)來說,目前的訓(xùn)練技術(shù)讓diffusion
直接跨越了GAN
領(lǐng)域調(diào)模型的階段,而是直接可以用來做下游任務(wù),是一個新的數(shù)學(xué)范式在圖像領(lǐng)域應(yīng)用的實(shí)例。
2 NovelAI
NovelAI
是基于人工智能的繪畫創(chuàng)作輔助工具,單純訓(xùn)練就使用了數(shù)千個網(wǎng)站的數(shù)十億張圖片。NovelAI
是一個商業(yè)化的網(wǎng)站,繪畫是需要付費(fèi)的,然而這次其商業(yè)模型疑似流出,不管是小白還是畫師都能體驗(yàn)一次AI創(chuàng)作的樂趣。這次流出的模型是stable-diffusion-webui
,也就是第一節(jié)介紹的擴(kuò)散算法。
3 AI繪畫環(huán)境搭建
主要分為以下步驟:
-
創(chuàng)建Python3.10的虛擬環(huán)境
conda create -n ai_draw python=3.10
虛擬環(huán)境相關(guān)操作請參考:Anaconda安裝與Python虛擬環(huán)境配置保姆級圖文教程(附速查字典)
-
在虛擬環(huán)境中安裝Pytorch
這步比較涉及顯卡相關(guān)的配置,比較復(fù)雜,請參考:最新CUDA/cuDNN與Pytorch保姆級圖文安裝教程(速查字典版) -
下載模型
stable-diffusion-webui
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
-
安裝依賴庫
首先進(jìn)入虛擬環(huán)境conda activate ai_draw
接著進(jìn)入
stable-diffusion-webui
根目錄運(yùn)行pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt
采用清華源可以更快完成安裝
-
下載模型和權(quán)重文件
模型文件model.cpkt
:model.cpkt,權(quán)重文件GFPGANv1.4.pth
:GFPGANv1.4.pth,模型文件移動到這個目錄stable-diffusion-webui-master\models\Stable-diffusion
,權(quán)重文件留在根目錄即可,最后的文件組織如圖所示 -
根目錄運(yùn)行啟動文件
python launch.py
期間會下載一些新的依賴,有可能超時報錯,多啟動幾次即可
4 體驗(yàn)AI創(chuàng)作
通過第三節(jié)的配置,成功后即可在終端看到
開放了一個本地端口,在瀏覽器中輸入即可
接下來測試最簡單的文本生成圖像功能:
- 輸入正面標(biāo)簽:
NSFW,anime fine details portrait of a white haired girl ,black eyes,wearing hoodie on the city street background, close-up view, anime masterpiece,4k, sharp high quality anime, artstation Prhololive, uruha_rushia, 1girl, bangs, bare shoulders, red eyes, blue dress, blue green hair,blue sleeves, blush, bow, breasts, chick, collarbone, detached collar, detached sleeves, double bun, eyebrows visible through hair,frills, hair orhament, medium hair, off-shoulder dress 1girl looking_at_viewer upper_body, too many flowers,kyoto animation, bishojo, bare_shoulders black sleeves yellow_eyes emeraldblue_hair, sailor_collar and neckerchief, detached_sleeves frilled_shirt_collar frills grey_shirt headset heart long_hairsleeveless shirt twintails verv long hair wide sleeves highres 2girl, two bishojo snuggled up selfie, with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing a school uniform,golden hour lighting, strong rim light, intense shadowse , Ernst Thoms
- 輸入反面標(biāo)簽:
lowres, bad anatomy, bad hands, text,error, missing fngers,extra digt ,fewer digits,cropped, wort quality ,low quality,normal quality, jpeg artifacts,signature,watermark, username, blurry, bad feet
- 設(shè)置采樣步長
sampling step
為28 - 配置
CFG Scale
為12 - 點(diǎn)擊
Generate
當(dāng)然這里還有img2img
等豐富的功能,讀者可自行測試文章來源:http://www.zghlxwxcb.cn/news/detail-817113.html
?? 更多精彩專欄:文章來源地址http://www.zghlxwxcb.cn/news/detail-817113.html
- 《ROS從入門到精通》
- 《機(jī)器人原理與技術(shù)》
- 《機(jī)器學(xué)習(xí)強(qiáng)基計劃》
- 《計算機(jī)視覺教程》
- …
到了這里,關(guān)于AI繪畫突然爆火?快速體驗(yàn)二次元畫師NovelAI(diffusion)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!