作者|梁德澎
?
AI 作圖領(lǐng)域的工具一直不盡人意,直到去年 8 月 Stable Diffusion 開源,成為AI 圖像生成領(lǐng)域無可爭辯的劃時代模型。
為了提升其推理效率,OneFlow 首度將 Stable Diffusion 模型加速至“一秒出圖”時代,極大提升了文生圖的速度,在AIGC領(lǐng)域引發(fā)巨大反響,并得到了 Stability.ai 官方的支持。至今,OneFlow 還在不斷刷新 SOTA 紀錄。
不過,由于目前大部分團隊主要是基于翻譯 API + 英文 Stable Diffusion 模型進行開發(fā),所以在使用中文獨特的敘事和表達時,英文版模型就很難給出正確匹配的圖片內(nèi)容,這對部分國內(nèi)用戶來說不太方便。
為了解決這一問題,國內(nèi)的IDEA 研究院認知計算與自然語言研究中心(IDEA CCNL)也開源了第一個中文版本的“太乙 Stable Diffusion”,基于0.2億篩選過的中文圖文對訓(xùn)練。上個月,太乙 Stable Diffusion 在 HuggingFace 上有近 15 萬下載量,是下載量最大的中文 Stable Diffusion。
近期,OneFlow 團隊為太乙 Stable Diffusion 適配了 OneFlow 后端,大大提升了推理性能,也可以做到一秒出圖。不少開發(fā)者好奇OneFlow使用了哪些優(yōu)化“秘笈”,后文將進行簡要解讀。
歡迎Star、運行 OneFlow 版太乙 Stable Diffusion:
?
https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion#without-docker文章來源:http://www.zghlxwxcb.cn/news/detail-485383.html
1對比 PyTorch,OneFlow 將“太乙 Stable Diffusion”推理速度提升1倍以上 ?
下面的圖表分別展示了在 A100 (PCIe 40GB / SXM 80GB),V100 ( SXM2 32GB ), RTX 2080,RTX 3080 Ti,RTX 3090, 和 T4 不同類型的 GPU 硬件上分別使用 PyTorch, 和 On文章來源地址http://www.zghlxwxcb.cn/news/detail-485383.html
到了這里,關(guān)于“零”代碼改動,靜態(tài)編譯讓太乙Stable Diffusion推理速度翻倍的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!