大白(●—●) 邀你回答

2024/03/15

谷歌发布 VLOGGER 模型，可根据输入图片和音频生成人物讲话视频！

谷歌发布的一个名为 VLOGGER 的项目。这个项目能够根据输入的图片和音频生成对应人物讲话的视频。但是个人感觉 VLOGGER 看起来没有阿里巴巴发布的 DreamTalk 和 EMO 自然，大家觉得呢？

VLOGGER 主要特点：
1. 3D运动的扩散模型：它可以根据一张人物图像生成由文本和音频驱动的说话人视频。
2. 创新的架构：项目包含一个创新的基于扩散的架构，通过时间和空间控制来增强文本到图像模型的能力。
3. 高质量视频生成：能够生成高质量、可变长度的视频，并通过人脸和身体的高级表示进行便捷控制。
4. 广泛的适用性：与之前的工作相比，VLOGGER不需要为每个人单独训练模型，不依赖人脸检测和裁剪，能生成完整的图像（包括脸部和身体），适用于广泛场景，如躯干可见或身份多样化，这对于正确合成具有沟通能力的虚拟人至关重要。

项目地址：https://enriccorona.github.io/vlogger/

AI神器 AI视频 Google VLOGGER 谷歌设计

收藏 关注话题 点赞 19

立即查看 AI神器的解决方案

效率翻倍！6 款不容错过的免费 AI 神器（五）

AIGC AI神器阅读 4.8w

查看详情

优设问答有问必答 👉 回答问题赢奖品

6分钟阅读

25分钟阅读

12分钟阅读

6分钟阅读

{{comTitle}} {{comSubtitle}}

菜单 优设网uisdc.com 优设网 - 学设计上优设

您还未登录

登录后即可体验更多功能

大白(●—●) 邀你回答

立即查看 AI神器 的解决方案

AIGCAI神器阅读 4.8w

Wo~本文的评论还空着，快来抢沙发

5.7k 设计师围观了该问题

为什么甲方总是指挥你做设计？快来看看你做对了没有？

< 上一篇

邀你回答

宫崎骏《你想活出怎样的人生》定档4月3日，将会是宫崎骏的'告别之作'吗？

下一篇 >

ZoeYZ

程远

土拨鼠

言川Artie

土拨鼠

优设读报 2025年04月15日 星期二

高德发布 AI 导航智能体，地图导航领域打响 AI 大战

科大讯飞旗下讯飞星辰 Agent 开发平台已全面支持 MCP

Google AI Studio 开放 Veo2 视频模型有限免费试用

武藏野美术大学发布 2025 年度主视觉：以「混沌中的新生」为核心理念

湖北美术学院 105 周年 LOGO 正式发布

近期热门问题

听说山西的午休是要写进合同的，你们公司有多长时间的午休呢？

7位设计师参与回答

上厕所超时被乐捐罚款？你公司有“乐捐”的规定吗？

7位设计师参与回答

智己汽车换新Logo，网友：白嫖了400万？

6位设计师参与回答

35岁就做不好互联网的工作了吗？

6位设计师参与回答

中南民族大学全新校园卡设计，8套方案你pick哪一款？

6位设计师参与回答

为什么上个班硬是上出了结婚的感觉？

6位设计师参与回答

优设官方微信群

添加管理员 招财

微信号: 扫码添加

严格审核打造高质量交流群

谷歌发布 VLOGGER 模型，可根据输入图片和音频生成人物讲话视频！

优设小黄鸡官方周边

扫码小店购买

关于我们

热门频道

设计灵感

支持与服务

官方社群

优设官方微信群

微信扫码 添加管理员 招财

微信号： 扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告

优设微博

优设AIGC

400W粉丝！每日更新设计干货

优设

强烈推荐！优设官方品牌微博

优优教程网

官方微博，海量教程看不完

优设基础训练营

零基础入门，带你成为软件高手

优设微信

每天官微五分钟

一年萌新变大神

扫码关注

优设新媒体矩阵等你来关注

湖北省文化创意产业

协会副会长单位

湖北工业大学

数字艺术产业学院理事单位

东方设计奖

全国高校创新设计大赛运营单位

工信国际

数智设计创新应用伙伴

微博十大影响力

设计美学机构

优设推荐：

扫码关注

菜单优设网 - 学设计上优设

立即查看 AI神器的解决方案

AIGC AI神器阅读 4.8w

优设读报 2025年04月15日星期二

添加管理员招财

微信扫码添加管理员招财

微信号：扫码添加