微软推出了一项名为Mora的视频生成项目,该项目利用先进的Agents技术来尝试复原Sora的视频生成能力。目前,Mora已经能够基本还原Sora的所有功能,并可以生成分辨率为1024*576的12秒视频。
这些复原的能力包括:将文本直接转换为视频、根据特定的文本条件将图片转换成视频、扩展已有的视频内容、实现视频到视频的编辑、串联多个视频片段,以及模拟数字世界等。
项目简介:原文链接
Mora项目基于一种新型的多AI智能体框架,融合了多个尖端的视觉AI智能体,旨在复刻Sora所展示的强大的通用视频生成能力。Mora能够灵活运用这些视觉智能体,在各种任务中成功地模仿了Sora的视频生成技巧。
通过广泛的实验验证,我们发现Mora在这些任务上的表现已经与Sora相当接近。从整体性能上评估,Mora与Sora之间仍然存在一些差距。但是,我们仍对Mora项目寄予厚望,希望它能够引领未来视频生成技术的发展方向,并通过多AI智能体的协同工作实现更多的突破。