推荐阅读
是的,如今不仅是搬砖人,数字人也加入了“内卷”的行列,就问你怕不怕。从上世纪 90 年代至今,数字人一直在默默发展,而近年来,随着 5G、AI 等技术的进步以及算力平台的迭代,数字人领域取得了显著的成果。
一觉醒来,Heygen 5.0 的最新升级再次让人发狂,他们推出了一款名为 Avatar in Motion 1.0 的新功能,与之前只能坐着或站着口播,做几个重复简单动作讲述的数字人相比,现在的版本可以让数字人动起来了,走动式口播和演示几乎已经与真人无异了,看不出来是数字人了。
视频引用自 heygen 官网
1. 语音克隆
自带声音同步转换功能,可以将人物的原始语言转换为其他语言,同时保留说话者的声线和语调特征,确保完成动作与声音的准确同步。当前的 HeyGen 可以将用户的脚本转换为 40 多种语言下 300 多种语音的自然发音。
2. 口型同步
它能够极其精确地保持口型同步,让一切都显得如此自然。用户可以从不同种族、年龄和姿势的 100 多个 AI 头像中进行选择,并使其以自然的口型同步进行念稿。
视频引用自 heygen 官网
3. 背景声保留
它能增强场景的真实感,让观众更加身临其境,仿佛置身于事件发生的现场。其次,背景声可以提供更多的信息,帮助我们更好地理解和感受所描述的情境。再者,它还能营造出特定的氛围,比如恐怖场景的背景声能让人更加紧张和惊悚。
4. 身体动作识别
原本生硬的动作如今得到了很大的改善,手部的摇摆以及走路坐下等动作更加流畅自然,增加了数字人的真实感。
HeyGen 5.0 数字人仿真逼真度的效果,大大的拓宽了数字人的应用场景,比如以下的应用领域:
视频引用自 heygen 官网
教育领域:可用于虚拟教室,能够为学生提供更加多样化的学习体验,完成重复性课程等。
娱乐领域:可以用于直播、电影等娱乐场景中,能为观众带来更加丰富和逼真的娱乐体验。
医疗领域:可以代替医生做一些医学知识讲解等,解放医生的时间、精力,有助于向患者普及医学知识,提高医疗服务效率。
商业领域:数字人可以用于虚拟演讲、客服等商业场景,例如通过数字人为用户提供虚拟客服服务。
Heygen 5.0 这项全新功能,作为一次革命性的技术革新,在虚拟角色的动作捕捉和声音克隆领域取得了惊人的突破。
它的面世标志着 Heygen 5.0 在 AI 虚拟角色制作技术上的再次跨越,使虚拟角色的呈现越发活泼、逼真,达到近乎难以辨别真伪的程度,真正做到了以假乱真。
- 创新体验:为用户带来全新的、沉浸式的互动体验,增强用户参与感。
- 提高效率:可在某些领域替代人类工作,提高工作效率和质量。
- 突破限制:不受时间、空间和物理限制,能够随时随地提供服务。
- 丰富内容:为各种媒体和娱乐形式提供更多创意和可能性。
- 成本优势:相对真人,可能具有成本优势,降低运营成本。
- 拓展业务:帮助企业开拓新的市场和业务领域。
- 探索未知:为人工智能和虚拟现实技术的发展提供新的探索方向。
从积极的方面来看,百花齐放的 AI 圈可以促进技术的创新和进步,推动 AI 技术的广泛应用,提高人们的生活质量和工作效率。同时,这也为创业者和投资者提供了更多的机会,推动了 AI 产业的发展。
总之,AI 数字人是一把双刃剑,我们需要在充分发挥其优势的同时,警惕可能带来的问题。技术快速进步的同时,确实存在着很多的风险,比如引发就业问题、数据安全和隐私问题泄露,被用于造假、制造假新闻或者实施网络诈骗等诸多不良违法行为。
因此,需要加强对 AI 技术的监管和评估,制定合理的政策和法规,规范数字人的发展,确保其安全可靠地应用于各个领域。
heygen 官网网站: www.heygen.com
欢迎关注「58UXD」的微信公众号:
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
AI时代的设计师生存手册
已累计诞生 648 位幸运星
发表评论 已发布5条
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓