打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
“毫无疑问的是,扩散模型已经在图像生成与视频生成任务上面得到了广泛的应用,但是的图像生成与视频模型变动越来越大。对于工业界而言,降低扩散模型的生成成本是一个相当重要研究领域。扩散步骤蒸馏已成成为一种减少推理步骤的有效方法,但是仍然没有取得明显的成果。为了解决单步视频生成难题,作者介绍了一种用于单步生成图像和视频的新方法-APT,因为它与通常在后训练阶段执行的监督微调相似。该方法利用预先训练的扩散模型,特别是扩散变换器 (DiT) 作为初始化,并使用对抗性训练目标针对真实数据继续训练 DiT。该模型是第一个在单个步骤(1280×720 24fps)中展示高分辨率视频生成的模型,超越了之前最先进的模型。在单个H100 GPU 上面,该模型可以在两秒钟内使用单个步骤生成两秒的 1280×720 24fps 视频。这个全球首个16B的GAN模型,让消失已久的GAN又重新回到了我们的视野中!”
项目主页-https://seaweed-apt.com/
论文链接-https://arxiv.org/pdf/2501.08316
01-APT背景简介
关注我,AI热点早知道,AI算法早精通,AI产品早上线!
禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!