最近AI视频生成领域真的是大招频频啊~~最开始是Runway发布了 Gen-2,Pika 1.0接踵而至,而google前不久刚发布了多模态模型Gemini,现在Google继续放大招,发布了一个基于大语言模型的视频生成技术:VideoPoet
这款 LLM 应用可以执行多种视频生成任务,例如文本生成视频、图像生成视频、视频风格化以及修补和扩展功能,甚至视频到音频的转化 VideoPoet 都能胜任。
这一次是对多模态大模型革命性的推动,大家觉得呢?
最近AI视频生成领域真的是大招频频啊~~最开始是Runway发布了 Gen-2,Pika 1.0接踵而至,而google前不久刚发布了多模态模型Gemini,现在Google继续放大招,发布了一个基于大语言模型的视频生成技术:VideoPoet
这款 LLM 应用可以执行多种视频生成任务,例如文本生成视频、图像生成视频、视频风格化以及修补和扩展功能,甚至视频到音频的转化 VideoPoet 都能胜任。
这一次是对多模态大模型革命性的推动,大家觉得呢?