OpenAI,昨晚发布他们的文生视频大模型Sora,如果用三个词来总结Sora,那就是“60s超长长度”、“超强语义理解”和“世界模型”。
首先是60s一镜到底,不止主人物稳定,背景里面的人物都稳定的难以置信。从大中景无缝切换到脸部特写。
第二个是单视频多角度镜头,现在的AI工作流都是单镜头单生成,一个视频里面有多角度的镜头,主体还能保证完美的一致性。
还有很重要的一点是,Sora是能够理解和模拟现实世界的模型的基础,我们相信这一功能将成为实现AGI 的重要里程碑。