打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
“ 在计算机视觉和图像处理领域,跨不同实例编辑图像的一致性能力至关重要,但在不同的图像中实现一致性编辑仍然是一项极具挑战性的任务。基于学习的方法往往缺乏适当的正则化,由于难以获得高质量的训练数据和执行一致性约束,导致编辑不一致。非优化方法依赖于注意力特征的隐式对应来进行外观转换,但难以应对不稳定的预测和内在的图像变化,导致编辑不一致或失真。本文提出了Edicho算法,它采用了一种基于扩散模型的无训练解决方案,其基本设计原则是使用显式图像对应关系进行直接编辑。 该算法具有即插即用的特性,与大多数基于扩散模型的编辑方法兼容,如ControlNet和BrushNet。”
项目主页-https://ezioby.github.io/edicho/
代码链接-https://github.com/EzioBy/edicho
论文链接-https://arxiv.org/pdf/2412.21079
01-Edicho背景简介
02-Edicho算法简介
该算法具有即插即用的特性,与大多数基于扩散模型的编辑方法兼容,如ControlNet和BrushNet。大量的实验结果证明了Edicho在不同环境下进行一致交叉图像编辑的有效性。
上图展示了该算法采用神经回归器Dust3R进行基于编辑的3D重建过程,整个通过匹配3D空间中的2D点来完成。
为了实现一致的编辑,作者提出了一种无需训练、即插即用的方法。该算法的整体流程如下所述:
首先,预测输入图像中的显式对应关系。
然后,将预先计算的对应关系注入预先训练的扩散模型中;
接着,在无分类器引导(CFG)中的两级注意力特征和噪声潜伏中引导去噪;
06-Edicho算法性能评估
06.01-主观效果性能评估
上图分别显示了该算法与多个SOTA的图像编辑方法在全局和局部编辑上的定性比较结果。通过观察与分析,我们可以发现:与其它方法相比,利用该方法进行图像编辑之间的图像具有高度一致性和主题一致性,例如猫的衣服。像MasaCtrl这样的隐含替代品在车顶、精灵的高领口和机器人的孔数方面都失败了。
06.02-客观效果性能评估
上表分别展示了该方法与多个SOTA方法在全局和局部编辑上的定量比较结果。其中TA表示文本对齐效果,EC表示编辑一致性。通过观察与分析,我们可以发现:该方法在TA与EC指标上都远超其它方法,这充分证明该算法的有效性。
07-Edicho算法效果展示
图7.2-Edicho算法编辑效果展示2
关注我,AI热点早知道,AI算法早精通,AI产品早上线!
禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!