OpenAI 周五在其官网上发表了博客文章,名为“驾驭合成声音的挑战和机遇”, 这也是 OpenAI 在官网首次展示了全新自定义音频模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
除了能合成音频之外,OpenAI 还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。
全文内容:OpenAI 官网
Voice Engine 应用场景: 1. 阅读助手:可以通过自然且富有情感的声音为非阅读者和儿童提供阅读辅助,实时个性化响应,与学生互动。 2. 内容翻译:可以翻译视频和播客等内容,使创作者和企业能够以流利且原汁原味的声音触达全球更多受众。 3. 服务全球:改善偏远地区的必要服务。 4. 帮助言语障碍人士:为言语障碍人士提供治疗应用,以及为有学习需求的人士提供教育增强功能,使残疾人能够进行交流。 5. 帮助病人恢复声音:帮助患有突发性或退行性言语障碍的患者恢复声音。
近日,Adobe 放了个大招,推出了这个 Adobe GenStudio 的神器。说实话,这简直就是咱们营销人的福音啊!以后做跨渠道活动,啥工具都不愁了,一站式搞定!
GenStudio 是基于生成式人工智能打造的,简单说,就是它懂你,知道你想要啥。用它来规划、制作、管理、发布和评估内容,那简直就是轻松加愉快。最关键的是,还能保证内容和品牌形象严丝合缝,不掉链子。
来说说它都有哪些牛X的功能吧:
1. 创作:有了 Adobe 的 AI 技术,咱们营销人也能秒变创作达人!快速出图,品质还高。而且都是基于品牌认证的模板,AI 护航,不怕品牌形象跑偏。 2. 内容中心:这个平台界面简洁明了,找素材、编辑、重复用、分享,全都方便得不行。再也不用东翻西找,浪费时间了。 3. 活动管理:GenStudio 还有个活动概览功能,活动简介、时间表一目了然。策划活动?那是分分钟的事! 4. 发布:更牛的是,GenStudio 还能和 Adobe Experience Cloud 的其他产品(比如 Journey Optimizer、Experience Manager、Marketo 和 Target)无缝对接,想导出到其他应用也是轻而易举。 5. 数据洞察:最后,还能实时看到内容在不同渠道的表现,AI 还能帮忙生成不同版本的内容,让活动效果更好。
Adobe GenStudio 试玩地址戳这里!
阿里通义千问迎来了一次重磅升级,其1000万字的长文档处理功能现已向所有人免费开放,这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起,无论是金融、法律、科研、医疗还是教育领域的专业人士,都可以通过通义千问的网站和APP,轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文,以及分析考试成绩和总结深度文章。
在金融领域,专业人士只需上传公司财报,通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息,帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后,通义千问还能生成公司在这一阶段内的业务变化、业绩趋势,并进行深入的财报分析。
在法律领域,通义千问同样展现出强大的能力。对于律师和法官而言,阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而,通义千问能够迅速阅读并分析这些法律文件,帮助用户迅速掌握法律条文的要点。输入特定案件信息后,通义千问还能给出相应的判罚建议,极大地提高了工作效率。
目前,通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用,展现出了其在智能科技领域的卓越实力。
微软推出了一项名为Mora的视频生成项目,该项目利用先进的Agents技术来尝试复原Sora的视频生成能力。目前,Mora已经能够基本还原Sora的所有功能,并可以生成分辨率为1024*576的12秒视频。
这些复原的能力包括:将文本直接转换为视频、根据特定的文本条件将图片转换成视频、扩展已有的视频内容、实现视频到视频的编辑、串联多个视频片段,以及模拟数字世界等。
项目简介:原文链接
Mora项目基于一种新型的多AI智能体框架,融合了多个尖端的视觉AI智能体,旨在复刻Sora所展示的强大的通用视频生成能力。Mora能够灵活运用这些视觉智能体,在各种任务中成功地模仿了Sora的视频生成技巧。
通过广泛的实验验证,我们发现Mora在这些任务上的表现已经与Sora相当接近。从整体性能上评估,Mora与Sora之间仍然存在一些差距。但是,我们仍对Mora项目寄予厚望,希望它能够引领未来视频生成技术的发展方向,并通过多AI智能体的协同工作实现更多的突破。
Adobe 公司为其 Substance 3D Sampler 和 Stager 应用整合了 Firefly 生成式人工智能功能,旨在帮助工业设计师、游戏开发人员和视觉特效专业人员更高效地完成 3D 相关工作。
Substance 3D Stager:这是一个基于Adobe Dimension重新构建的应用,允许用户在3D场景中轻松组建模型、材质和灯光环境,并生成高质量的虚拟照片。 Substance 3D Sampler:由Substance Alchemist进化而来,Sampler简化了材质创建过程,用户可以通过一张照片快速生成可调节参数的智能3D材质。
AI功能更新:本次更新引入了两项AI功能:
1、文本到纹理(Text to Texture):创作者可以输入文本提示词,在3D物体表面生成逼真或风格化的纹理,无需使用实物原型、图片库或手动摄影。
2、生成背景(Generative Background):基于用户输入的文本提示词,创建详细的背景图片,并能智能地将对象合成到场景中,匹配透视和光照。
给大家推荐一个 AI 知识系统学习的Datawhale,Datawhale是一个致力于人工智能教育的组织,旨在帮助学习者通过实践项目来掌握AI相关的知识和技能,也提供论坛便于大家交流学习心得!
以下是网站内容的概述:Datawhale官网
- AI学习起点:Datawhale鼓励每个人学习和探索人工智能,以共同塑造和掌握AI的未来。 - 学习路径:网站提供了多个学习路径,包括数据分析、计算机视觉、自然语言处理和推荐系统等,以帮助学习者系统地学习AI领域的知识。 - 大模型应用开发:Datawhale提供了面向小白开发者的大模型应用开发教程,结合个人知识库助手项目,教授大模型开发的重点入门知识。 - LLM入门课程:这是一个面向开发者的LLM(Large Language Models)入门教程,基于吴恩达老师的大模型系列课程内容,提供中文翻译和范例代码,指导开发者如何基于LLM开发应用程序。 - GPT - Prompt教程:Datawhale设计了GPT - Prompt教程,旨在帮助学习者更好地利用GPT等工具提高学习和工作效率。 - 南瓜书 PumpkinBook:这是一本开源协作学习笔记,作为周志华《机器学习》的伴侣书,旨在帮助初学者提升数学基础能力。 - Joyful-Pandas:这个教程涵盖了pandas库的所有核心操作与特性,分为基础知识、操作和数据三大模块。 - fantastic-matplotlib:关于Matplotlib的数据可视化教程,Matplotlib是Python中重要的数据可视化工具,本教程适合需要进行数据可视化的人员。
小伙伴们,听说过Magnific AI这款神器吗?感觉比较适合平时喜欢P图的朋友,或者摄影师,当然了需要大量后期修图的设计师也可以试试。
最厉害的是,它能够将图像分辨率提升至最高1亿像素,支持最高放大16倍,达到10000×10000的分辨率。该工具不仅能够放大图像,还能根据用户的提示和参数添加或重构细节,使图像变得更加高清和细腻。
Magnific AI还提供了像素级AI重绘功能,通过魔法般的重绘图像细节和像素块,保证清晰度。
Magnific AI具有灵活的设置调整功能,支持输入提示词、提供Creativity、HDR、均衡等调整选项,以及针对人像、插画、游戏资产、自然风光、摄影、3D渲染等多种优化场景。
最近,Magnific AI的照片风格化功能上线了,可以将你的任意照片转换成你想要的任意风格,喜欢摄影的朋友,推荐一定要试一试。Magnific AI 官网
谷歌发布的一个名为 VLOGGER 的项目。这个项目能够根据输入的图片和音频生成对应人物讲话的视频。但是个人感觉 VLOGGER 看起来没有阿里巴巴发布的 DreamTalk 和 EMO 自然,大家觉得呢?
VLOGGER 主要特点: 1. 3D运动的扩散模型:它可以根据一张人物图像生成由文本和音频驱动的说话人视频。 2. 创新的架构:项目包含一个创新的基于扩散的架构,通过时间和空间控制来增强文本到图像模型的能力。 3. 高质量视频生成:能够生成高质量、可变长度的视频,并通过人脸和身体的高级表示进行便捷控制。 4. 广泛的适用性:与之前的工作相比,VLOGGER不需要为每个人单独训练模型,不依赖人脸检测和裁剪,能生成完整的图像(包括脸部和身体),适用于广泛场景,如躯干可见或身份多样化,这对于正确合成具有沟通能力的虚拟人至关重要。
项目地址:https://enriccorona.github.io/vlogger/
小伙伴们,Microsoft Copilot 的重大更新!定制 Copilot GPT 现已推出。这意味着你可以在微软的工具里创建自己的 GPT 并共享它们~
具体方法如下:
→ 创建Copilot GPT ①访问官网:https://copilot.microsoft.com/ ②点击右侧的“查看所有 Copilot GPT” ③然后选择“创建新的 Copilot GPT”
→设置你的Copilot ①关注 creation chat ②设置名称、任务等 ③流程与 ChatGPT Plus 相同,无需个人资料照片
→配置你的Copilot ①可以单击“配置”选项卡 ②在这里你可以直接选择名称、描述、提示... ③你还可以添加知识文件并启用/禁用互联网访问和 Dall-E 3
→发布和使用 ①在发布之前单击“预览”按钮进行尝试 ②你只能为自己或任何有链接的人发布你的Copilot ③它将自动添加到右侧的 GPT 列表中