GitHub - hpcaitech/Open-Sora: Unofficial implementation of OpenAI's Sora
Open-Sora已涵蓋:
提供完整的Sora復(fù)現(xiàn)架構(gòu)方案,包含從數(shù)據(jù)處理到訓(xùn)練推理全流程。
支持動態(tài)分辨率,訓(xùn)練時可直接訓(xùn)練任意分辨率的視頻,無需進(jìn)行縮放。
支持多種模型結(jié)構(gòu)。由于Sora實際模型結(jié)構(gòu)未知,我們實現(xiàn)了adaLN-zero、cross attention、in-context conditioning(token concat)等三種常見的多模態(tài)模型結(jié)構(gòu)。
支持多種視頻壓縮方法。用戶可自行選擇使用原始視頻、VQVAE(視頻原生的模型)、SD-VAE(圖像原生的模型)進(jìn)行訓(xùn)練。
支持多種并行訓(xùn)練優(yōu)化。包括結(jié)合Colossal-AI的AI大模型系統(tǒng)優(yōu)化能力,及Ulysses和FastSeq的混合序列并行。文章來源:http://www.zghlxwxcb.cn/news/detail-838187.html
1、Sora算法復(fù)現(xiàn)方案
????????在Sora的技術(shù)報告中,Sora使用了一個視頻壓縮網(wǎng)絡(luò)將各種尺寸的視頻壓縮成一個隱空間(latent space)的時空塊序列(a sequence of patial temporal patch文章來源地址http://www.zghlxwxcb.cn/news/detail-838187.html
到了這里,關(guān)于[論文筆記] Open-Sora 1、sora復(fù)現(xiàn)方案概覽的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!