引言
傳統(tǒng)圖像崗轉(zhuǎn)AIGC,經(jīng)過半個月學(xué)習(xí),了解文生圖模型Stable Diffusion SD所依賴的模塊及算法流程,了解ControlNet算法流程,成功部署云端WebUI,進行階段性總結(jié)。
了解一個新領(lǐng)域或新技術(shù),首先了解基礎(chǔ)概念,才能有效閱讀論文或文章。最有效的方法是閱讀一篇經(jīng)典論文,并了解文中涉及的專有名詞。但,開始就上手英文論文,辨別相關(guān)名詞有難度,那么尋找國內(nèi)大牛寫的文章作為替代,是個明智的選擇。這里又有個問題:尋找干貨文章費時,而且存在能否辨別的問題
由于尋找中文博客不確定性較大,最終選擇先從原文開始。在啃完兩篇英文論文后,回過頭閱讀26篇文章,挑選一篇認(rèn)為適合第一階段閱讀的博客,分享出來。
其次,學(xué)習(xí)新知識的模式構(gòu)建,是學(xué)習(xí)能力強的關(guān)鍵。分享我快速了解一項新技術(shù)的問題框架。
最后附上論文地址,閱讀原文,可以幫助形成自己的理解。
以上三個步驟的時間投入占比分別為:50%,20%,30%。
基礎(chǔ)概念
Stable Diffusion原理詳解_stable diffusion csdn-CSDN博客https://jarod.blog.csdn.net/article/details/129280836
這篇博客涉及的知識點和算法解釋,個人認(rèn)為比較準(zhǔn)確,通過文章了解專有名詞過程中也能對技術(shù)有初步的認(rèn)識
了解術(shù)語過程中,存在一個術(shù)語引出另一個術(shù)語,另一個術(shù)語又引出另一個術(shù)語的問題,造成學(xué)習(xí)過程無法快速收斂,可對第一二層專有名詞簡單了解,控制學(xué)習(xí)周期(簡單了解的定義:知道它的作用,它的輸入、輸出)。
以下列舉認(rèn)為第一階段可能影響周期,簡單了解即可的術(shù)語:
- VAE
- UNet
- 交叉注意力機制
- 條件去噪自編碼器
問題框架
一個新技術(shù)必須要能回答以下兩個問題。因此,針對某個技術(shù)探尋問題答案能快速形成一個正確的概念。
- 技術(shù)解決了什么問題?
- 技術(shù)達到了什么效果?
有了概念之后,進一步了解技術(shù)的機制和核心創(chuàng)新點。
- 技術(shù)的大致流程、輸入和輸出是什么?
- 技術(shù)創(chuàng)新點的體現(xiàn)和位置?
閱讀原文
初步了解基礎(chǔ)概念和算法流程之后,可進一步閱讀原文,文章中的諸多細(xì)節(jié),能幫助形成自己的理解。
High-Resolution Image Synthesis with Latent Diffusion Models :Stable Diffusion文章來源:http://www.zghlxwxcb.cn/news/detail-841939.html
Adding Conditional Control to Text-to-Image Diffusion Models :ControlNet文章來源地址http://www.zghlxwxcb.cn/news/detail-841939.html
到了這里,關(guān)于傳統(tǒng)圖像處理崗切換AIGC方向分享的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!