首席爆料师邀你回答

8.0k 设计师已围观

2024/02/29

太炸裂了！阿里开发出 AI 图生视频模型EMO，1 张图片加音频就可以做会说话的头像视频！

近期，阿里巴巴智能计算研究所提出了一种新的生成式框架 EMO，是一种富有表现力的音频驱动的肖像视频生成框架，用户只需提供一张照片和一段音频文件，EMO就能生成会说话唱歌的AI视频，实现无缝对接的动态小视频，最长时间可达1分30秒左右。这项技术的应用场景非常广泛，从电视剧角色的语音合成到音乐视频中的虚拟表演者，都有可能被AI技术所取代。

EMO框架使用Audio2Video扩散模型，通过三个阶段的技术处理，包括帧编码、音频编码和去噪操作，以及参考注意力和音频注意力机制，来生成富有表现力的人像视频。

目前，EMO 框架上线到 GitHub 中，相关论文也在 arxiv 上公开。

GitHub：https://github.com/HumanAIGC/EMO

论文：https://arxiv.org/abs/2402.17485

太炸裂了！阿里开发出 AI 图生视频模型EMO，1 张图片加音频就可以做会说话的头像视频！

太炸裂了！阿里开发出 AI 图生视频模型EMO，1 张图片加音频就可以做会说话的头像视频！

AIGC AI神器 AI视频人工智能阿里巴巴

收藏 关注话题 点赞 36

Midjourney实战案例！大厂活动海报设计全流程

立即查看 AIGC 的解决方案

Midjourney实战案例！大厂活动海报设计全流程

AIGC AI绘画阅读 7.2w

查看详情

优设问答有问必答 👉 回答问题赢奖品

{{ moreBtnTxt }}

4.2k 设计师围观了该问题

各位设计师，2023年度个税汇算今起开始，大家可以申请办理退税啦！

< 上一篇

返回问答首页

2.2k 设计师围观了该问题

Lightricks 官宣，生成式AI电影制作平台—LTX Studio，今年有望看到AI制作的电影上映吗？

下一篇 >

阅读相关文章

Zhan

2024/05/18

阅读 7.2w

AI创作

免费！让图片放大不失真的位图转矢量图神器 Tmttool

推荐一款免费的位图转矢量图在线AI神器，矢量化效果无敌。

AI神器 svg.tmttool

3分钟阅读

土拨鼠

2020/07/07

阅读 7.7w

AI创作

想分离人声和伴奏？这个人工智能网站能帮你！

本文将用户上传的音乐分离为人声和伴奏，而且100% 全自动处理，操作简单，分离速度很快，不会损失或破坏音乐音质。

AIGC 人声分离

3分钟阅读

大猫404（灵感激流）

2023/06/24

阅读 8.7w

AI创作

新手科普！常用的Stable Diffusion模型与提示词总结

本文总结了常用的Stable Diffusion 模型和相关的提示词教程，适合新手快速入门

1分钟阅读

夏花生

2024/09/20

阅读 3.3w

AI创作

Runway Gen-3的视频转绘功能太牛了！大片制作0门槛！

Runway 推出的 V2V 功能将 AI 视频在风格转绘上的水平提升到了一个新的高度，再次秀了一波「AI 视频生成王者」的实力。

10分钟阅读

夏花生

2023/07/26

阅读 13.6w

AI创作

Pika！又一个AI短视频生成神器，免费使用！

最近又新出现了一款新的 AI 视频生成工具 Pika，功能与 Gen-2 相似，并且可以免费使用。

9分钟阅读

{{comTitle}} {{comSubtitle}}

太炸裂了！阿里开发出 AI 图生视频模型EMO，1 张图片加音频就可以做会说话的头像视频！

我来回答

热门频道

设计灵感

支持与服务

官方社群
优设官方微信群
01优设AIGC自学交流群
02优设小红书个人IP交流群
03优设设计师交流群
04优设UI设计师交流群
05优设交互设计师交流群
06优设电商交流群
07优设私单群

08优设硬件种草交流群
09优设同城搭子群
10优设大学生交流群
11优设插画师交流群
12优设平面品牌设计师交流群
13优设3D设计师交流群
14优设摄影剪辑爱好者交流群
微信扫码添加管理员招财

微信号：扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告
优设微博

@
优设AIGC
400W粉丝！每日更新设计干货
@
优设
强烈推荐！优设官方品牌微博
@
优优教程网
官方微博，海量教程看不完
@
优设基础训练营
零基础入门，带你成为软件高手
优设微信

每天官微五分钟

一年萌新变大神

扫码关注

1000W

优设新媒体矩阵等你来关注

优优教程网

优设大课堂

设计师导航