国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

AIGC內(nèi)容分享(十八):AIGC在天貓商品海報生成上的探索

這篇具有很好參考價值的文章主要介紹了AIGC內(nèi)容分享(十八):AIGC在天貓商品海報生成上的探索。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

目錄

項(xiàng)目背景

目標(biāo)拆解

方案調(diào)研

???方案一 SD + Outpainting???????

???方案二 SD Inpainting + Reference Only

???方案三 基于Reference的Diffusion算法

???方案四 SD + Lora/Dreambooth

優(yōu)化方向

???探索一 VAE增強(qiáng)

???探索二 圖像超分

???探索三 ?貼圖

線上方案

測試效果

線上效果

下一步探索方向

引用


項(xiàng)目背景

靈感藝術(shù)家項(xiàng)目,旨在通過AIGC繪圖能力,聯(lián)合商家打造低門檻+高趣味性的宣傳海報設(shè)計大賽,為新品進(jìn)行宣傳和造勢。同時也是為了給消費(fèi)者提供參與新品宣發(fā)的通道。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

目標(biāo)拆解

GPT部分采用通義千問大語言模型,詳見其技術(shù)文檔。本文重點(diǎn)介紹海報風(fēng)格的圖像生成部分,分為商品海報、皮克斯,二次元,寫實(shí)四種風(fēng)格:

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

皮克斯、二次元、寫實(shí)三個風(fēng)格,實(shí)現(xiàn)思路比較清晰,屬于標(biāo)準(zhǔn)的文生圖,基于MJ、SD都可以實(shí)現(xiàn)。分析MJ和SD的優(yōu)缺點(diǎn)的文章有很多,不做贅述,我們最終選擇SD作為文生圖的算法方案,核心在于SD開源,可塑性強(qiáng)。基于diffusers,我們重寫了一套SD實(shí)現(xiàn),支持VAE、ControlNet、Lora、Embedings等功能,根據(jù)業(yè)務(wù)特點(diǎn),定制了warmup、auto_predict等能力。比較輕松的解決了這三個風(fēng)格的生成問題。

算法的難點(diǎn)在于商品海報的風(fēng)格生成,品牌方要求商品高度還原,并且生成的海報,像素清晰、細(xì)節(jié)豐富、具備高級感。要求是豐滿的,而現(xiàn)實(shí)是骨感的。商品細(xì)節(jié)復(fù)雜,特別是帶有文字時,很難生成。并且繪圖靈感由用戶文字隨機(jī)輸入,出圖效果幾乎是不可控的。為此,我們進(jìn)行了大量調(diào)研,并做了一些優(yōu)化嘗試。

方案調(diào)研

以香奈兒5號香水為例,初步嘗試了4套方案。

???方案一 SD + Outpainting

簡述:固定商品位置,重繪商品之外的區(qū)域。

優(yōu)點(diǎn):不會影響香水的外觀。

缺點(diǎn):圖片中人物、背景與香水的位置關(guān)系很難控制,有比較明顯的違和感。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

???方案二 SD Inpainting + Reference Only

簡述:以商品圖信息注入attention層中,來控制unet生成相似的圖像。

優(yōu)點(diǎn):可以完全保留預(yù)生成的背景。

缺點(diǎn):香水還原度低。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

???方案三 基于Reference的Diffusion算法

簡述:基于一張參考商品圖,生成較相似的商品

代表:PBE, IP Adapter, Anydoor…

優(yōu)點(diǎn):泛化性強(qiáng),無需對每個商品單獨(dú)訓(xùn)練

缺點(diǎn):商品細(xì)節(jié)依舊不夠還原copy&paste過于嚴(yán)重

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

???方案四 SD + Lora/Dreambooth

簡述:微調(diào)模型,注入商品外貌信息

優(yōu)點(diǎn):商品外貌還原度較高,且出圖率較穩(wěn)定

缺點(diǎn):文字等細(xì)節(jié)還原度仍然不夠高;且細(xì)節(jié)部分越小,其扭曲失真程度就越嚴(yán)重

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

方案四最接近想要的效果,但距離我們的要求,還有很大的差距。

優(yōu)化方向

???探索一 VAE增強(qiáng)

對LDM(SD的主要引用論文)模型的結(jié)構(gòu)進(jìn)行分析,初步懷疑細(xì)節(jié)還原不足的核心原因在于VAE從像素空間到隱空間相互轉(zhuǎn)換過程中,丟失了細(xì)節(jié)信息。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

為了驗(yàn)證猜想,我們做了一個測試,對一張圖片進(jìn)行十次encoder和decoder操作,文字等圖像細(xì)節(jié)已經(jīng)開始模糊。我們想了一個方法,對VAE丟失的信息進(jìn)行補(bǔ)償,還原度有比較可觀的增強(qiáng)。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

但距離完美還原,依然還有差距。

???探索二 圖像超分

既然細(xì)節(jié)難以還原,那么把細(xì)節(jié)放大,是否還原度就可以提升?為了驗(yàn)證這個猜想,我們做了如下的實(shí)驗(yàn)。
在256 * 256分辨率下,文字幾乎無法辨認(rèn)。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

在512 ?512分辨率下,相對256 ?256有明顯改善,而且 2.X版本的還原度優(yōu)于1.X版本。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

升級到SDXL后,文字還原度進(jìn)一步增強(qiáng)。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

像素提升,還原度確實(shí)有提升。很自然的,我們想到可以在生成的圖像上,對文字等細(xì)節(jié)部分進(jìn)行超分,然后在refiner階段,訓(xùn)練專屬的 controlnet,進(jìn)一步提升還原度。

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

經(jīng)過多次調(diào)整,細(xì)節(jié)還原度能達(dá)到90%以上。但距離完美還原,依然還有一點(diǎn)差距。

???探索三 ?貼圖

既然文字等細(xì)節(jié)非常難還原,那么是否可以直接把文字部分復(fù)制粘貼回去?

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC


通過提取原始商品的文字區(qū)域,貼圖到生成商品的對應(yīng)區(qū)域,完美還原文字細(xì)節(jié)。

線上方案

經(jīng)過上述幾個方向的探索,初步解決了香水等商品的海報生成問題,但對復(fù)雜圖文的商品依然很難還原,例如:

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

既要完美還原,又要增加泛化性,索性,全圖貼回去【狗頭】。方案如下:

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

  1. 離線模塊通過文生圖產(chǎn)生一個背景圖庫。

  2. 離線模塊預(yù)置多角度商品圖,解決商品角度的多樣性問題。

  3. 從背景圖庫中選擇一張跟當(dāng)前商品最相關(guān)的圖作為引導(dǎo)圖。解決商品和背景不協(xié)調(diào)的問題,提高出圖率。

  4. 由商品圖和背景圖一起,生成線框圖和商品白底圖以及對應(yīng)的mask。

  5. 通過Stable Diffusion+Canny Controlnet+Reference生成初步的商品海報。

  6. 使用SAM和LAMA抹除商品,防止后面貼圖時,邊緣出現(xiàn)對不齊的情況。

  7. 將抹去商品的圖和步驟4中的商品白底圖、對應(yīng)的mask作為輸入,合成新的圖像。

  8. 提取步驟5中的生成商品的光影信息,投射到步驟7的商品上,生成最終的商品海報。

總結(jié)一下

  1. 通過Copy&Paste的方式,保證無差別還原。

  2. 通過預(yù)置引導(dǎo)圖解決了完全隨機(jī)性,提高了出圖率。

  3. 通過兩步生成解決了倒影等問題。圖像精美,具備高級感。

  4. 通過擦除重建以及圖像融合技術(shù),緩解了商品邊緣的毛刺問題。

  5. 通過從生成圖上提取光影,映射到貼圖,解決了光影不和諧的問題。

測試效果

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

線上效果

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

出圖率95%以上,基本每張圖都能看,大部分圖能抗打。A10 GPU上,單卡出圖速度3-5秒。

下一步探索方向

初步看,效果可以接受了,但依然還有一些可以提升的空間,比如:

如何進(jìn)一步提升復(fù)雜海報的生成效果,增加遮擋關(guān)系?

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

如何解決商品與背景的比例和諧,GLIGEN可能是答案?

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

貼圖總顯得不那么算法,是否有機(jī)會繼續(xù)提升VAE的能力,或者去掉VAE。Consistency Decoder可以試試?

sd xl給一個產(chǎn)品圖生成類似的產(chǎn)品,AI(人工智能) 內(nèi)容分享,AIGC 內(nèi)容分享,AIGC

最后,探索從未停止,AIGC永不眠。

引用

[1] IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models
[2] Paint by Example: Exemplar-based Image Editing with Diffusion Models
[3] AnyDoor: Zero-shot Object-level Image Customization
[4] High-Resolution Image Synthesis with Latent Diffusion Models
[5] SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis
[6] GLIGEN: Open-Set Grounded Text-to-Image Generation
[7]?https://github.com/openai/consistencydecoder文章來源地址http://www.zghlxwxcb.cn/news/detail-790725.html

到了這里,關(guān)于AIGC內(nèi)容分享(十八):AIGC在天貓商品海報生成上的探索的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • AIGC內(nèi)容分享(四十):生成式人工智能(AIGC)應(yīng)用進(jìn)展淺析

    AIGC內(nèi)容分享(四十):生成式人工智能(AIGC)應(yīng)用進(jìn)展淺析

    目錄 0? ?引言 1? ?以ChatGPT為代表的AIGC發(fā)展現(xiàn)狀 1.1? 國外AIGC應(yīng)用發(fā)展現(xiàn)狀 1.2? 國內(nèi)AIGC應(yīng)用發(fā)展現(xiàn)狀 2? ?AIGC的技術(shù)架構(gòu) (1)數(shù)據(jù)層 (2)算力基礎(chǔ)設(shè)施層 (3)算法及大模型層 (4)AIGC能力層 (5)AIGC功能層 (6)AIGC應(yīng)用層 3? ?AIGC面臨的機(jī)遇與挑戰(zhàn) 3.1? AIGC帶來的機(jī)遇 (

    2024年02月19日
    瀏覽(26)
  • [Java生成商品的海報圖片 ]

    目錄 前言:? 生成商品海報圖片需要處理兩個問題: 依賴: 編寫生成海報代碼 另一個方法: 補(bǔ)全上面的main測試方法: ? ? ?你知道的 這只是一個簡單筆記...... 1)將文字和二維碼合成為一張圖片; 2)將圖片保存到文件。 其中,com.google.zxing是一個二維碼處理庫,com.itextpdf是一

    2024年02月08日
    瀏覽(23)
  • AIGC時代,分享11款超實(shí)用AI生成內(nèi)容檢測工具

    AIGC時代,分享11款超實(shí)用AI生成內(nèi)容檢測工具

    前往未來百科查看全部AI內(nèi)容檢測工具箱 在數(shù)字內(nèi)容創(chuàng)作的世界中,高質(zhì)量的內(nèi)容對至關(guān)重要。但隨著創(chuàng)建的內(nèi)容量不斷增加,確保內(nèi)容是原創(chuàng)的、高質(zhì)量的非常具有挑戰(zhàn)性。 AI 內(nèi)容檢測器指的是一種利用人工智能技術(shù)來自動化審核和識別不當(dāng)、有害或非法內(nèi)容的工具。它可

    2024年02月06日
    瀏覽(44)
  • 數(shù)據(jù)代碼分享|R語言基于逐步多元回歸模型的天貓商品流行度預(yù)測

    數(shù)據(jù)代碼分享|R語言基于逐步多元回歸模型的天貓商品流行度預(yù)測

    本文通過利用回歸模型對天貓商品流行度進(jìn)行了研究,確定了決定天貓商品流行度的重要因素。并講述、論證了預(yù)測天貓商品流行度是天貓商品交易的至關(guān)重要的環(huán)節(jié)。通過對天貓商品流行度預(yù)測技術(shù)的發(fā)展和探討,深度剖析了天貓商品流行度預(yù)測這個研究課題 ( 點(diǎn)擊文末

    2024年02月16日
    瀏覽(22)
  • AIGC內(nèi)容分享(二十):「AI視頻生成」技術(shù)核心基礎(chǔ)知識和模型應(yīng)用

    AIGC內(nèi)容分享(二十):「AI視頻生成」技術(shù)核心基礎(chǔ)知識和模型應(yīng)用

    目錄 何為AI視頻? 一、技術(shù)發(fā)展概況 二、代表模型及應(yīng)用??????? 三、仍存在許多技術(shù)難點(diǎn) 「 AI 視頻」 通常指的是由人工智能(AI)技術(shù)生成或處理的視頻。這可能包括使用深度學(xué)習(xí)、計算機(jī)視覺和其他相關(guān)技術(shù)來改善視頻的質(zhì)量、內(nèi)容或生成全新的視頻內(nèi)容。一

    2024年01月18日
    瀏覽(25)
  • AIGC內(nèi)容分享(五十三):AIGC|深入淺出一個完整的視頻生成系統(tǒng)「VGen」核心基礎(chǔ)知識

    AIGC內(nèi)容分享(五十三):AIGC|深入淺出一個完整的視頻生成系統(tǒng)「VGen」核心基礎(chǔ)知識

    目錄 一、VGen整體架構(gòu) 二、VGen核心基礎(chǔ)內(nèi)容 三、快速上手使用VGen進(jìn)行視頻生成 四、VGen與SVD的比較 「VGen」 是一個基于擴(kuò)散模型的視頻生成系統(tǒng),提供以視頻生成擴(kuò)散模型為中心的強(qiáng)大代碼庫,具有先進(jìn)的視頻生成模型。VGen的整體架構(gòu)主要圍繞三個關(guān)鍵領(lǐng)域: 基本模型、創(chuàng)

    2024年01月21日
    瀏覽(29)
  • AI生成新春祝福海報,AIGC從“炫技”走向日常

    在ChatGPT的帶動下,AIGC可以說是過去一年里最火的概念。 就在臨近春節(jié)的日子里,一款名為“寫作蛙”的微信小程序正在悄然流行。簡單輸入幾句祝福語,就能自動生成圖文并茂的祝福海報,包括一段應(yīng)景的祝福語和一張節(jié)日氛圍滿滿的照片,讓AIGC和普通網(wǎng)民來了場近距離的

    2024年02月08日
    瀏覽(22)
  • 【AIGC】只要10秒,AI生成IP海報,解放雙手?。?!

    1、云端部署(配置不行的小伙伴看)+ 云端模型放置位置 2、本地部署(配置達(dá)標(biāo)的小伙伴看) 3、運(yùn)用SD訓(xùn)練IP的流程和技巧(LoRA篇) 4、運(yùn)用SD穩(wěn)定生成高質(zhì)量IP海報 眾所周知,各大廠目前都在AIGC的領(lǐng)域探索實(shí)踐,也有非常多的外部設(shè)計師制作了大量的AIGC相關(guān)授課,很多同

    2024年02月08日
    瀏覽(21)
  • 前端生成分享海報的幾種方法

    1,使用painter插件 ? ?適用于微信小程序及uniapp的小程序端 ①,引入插件painter ? ?克隆地址:https://gitcode.net/mirrors/Kujiale-Mobile/Painter ? ?下載的 painter 放到微信小程序的 components 目錄下 ②在json文件中引入 \\\"usingComponents\\\": { ????????\\\"painter\\\":\\\"/components/painter/painter\\\" }, 注:在u

    2024年02月21日
    瀏覽(25)
  • 微信小程序?qū)崿F(xiàn)生成分享海報案例

    微信小程序?qū)崿F(xiàn)生成分享海報案例

    一、引入插件painter (1)克隆地址:https://gitcode.net/mirrors/Kujiale-Mobile/Painter (2)下載的 painter 放到小程序的 components 目錄下 二、頁面中引入插件 (1)頁面的 json 文件 (2)頁面的 wxml 文件 其中 painter 插件可以獲取繪制出來的圖片路徑, image 標(biāo)簽展示出來 三、繪制海報 1、

    2024年02月08日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包