刚刚,OpenAI 官方账号发布的一支由 Sora 制作的MV(Music Video)——《Worldweight》
这支 MV 的音乐是由艺术家 AugustKamp 作曲,而画面内容则是通过 Sora 来生成的。AugustKamp 表示,Sora 使得他能够将原本只存在于他心中的想象转化为可以与他人共享的艺术形式。这并非他首次使用AIGC技术来制作MV,他之前已经在 Instagram 上分享过由 Sora 生成的 MV 片段。
但是和以往不同的是,全球知名的艺术家,包括麻辣鸡(NickiMinaj)、水果姐(KatyPerry)、碧梨(BillieEilish)等,联名抗议AIGC技术的使用。他们认为AIGC技术在未经补偿的情况下使用艺术家的声音、作品来训练AI模型,并稀释支付给艺术家的版税池,这些问题不仅损害了艺术家的经济利益,也对他们的创作自由和艺术价值构成了威胁。
科技的发展与创造力的边界在哪里?从 MV 到音乐剧。AI如何重塑我们的音乐体验呢?欢迎在评论区留言讨论!
继上线视频生成功能后,Dreamina 又上线了一个新功能——智能画布。该功能集成了 mj、sd 和 PS 的功能,让用户能够在一个平台上完成多种操作,无需在不同的软件之间切换。Dreamina 智能画布的核心特点之一是支持多图层的 AI 可控能力,如:边缘保持,支持超清、重绘、抠图、扩图等丰富的后编辑能力。
以下是 Dreamina 功能概况: - 智能画布功能:Dreamina的智能画布支持多图层的AI可控能力,包括边缘保持、超清重绘、抠图、扩图等后编辑能力。这意味着用户可以像使用Photoshop一样操作多个图层,并通过AI生成新的图片。 - 提高工作效率:智能画布的智能化操作方式不仅提高了工作效率,还降低了操作难度,使得更多用户能够轻松上手。 - 应用场景: - 制作小程序产品宣传图 - 生成品牌的创意宣传海报 - logo创意玩法,将品牌logo嵌入图片中 - 对小企业和个人店铺的优势:对于宣传费用有限的小企业和个人店铺,Dreamina提供了一个免费制作宣传图的工具。
→ 官方使用教程文档
哇塞,W&B团队真是太牛了!他们开发的这个开源工具OpenUI,简直是我们设计师的福音啊!你只需用文字描述一下你想要的UI界面,OpenUI就能立刻帮你渲染出效果,实时呈现你的设计想法。
更神奇的是,你还可以通过聊天的方式随时修改设计,而且它能轻松将HTML转换成React、Svelte、Web Components等各种前端框架的代码。这简直就是设计界的神器啊!
我试了试,发现它现在用的是GPT模型,效果还挺不错的。虽然项目还有些小瑕疵,但已经很有潜力了,绝对值得继续深入研究。对于我们设计师来说,这绝对是个能大大提升工作效率的好帮手!
OpenUI 线上试玩戳这里!
OpenAI 周五在其官网上发表了博客文章,名为“驾驭合成声音的挑战和机遇”, 这也是 OpenAI 在官网首次展示了全新自定义音频模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
除了能合成音频之外,OpenAI 还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。
全文内容:OpenAI 官网
Voice Engine 应用场景: 1. 阅读助手:可以通过自然且富有情感的声音为非阅读者和儿童提供阅读辅助,实时个性化响应,与学生互动。 2. 内容翻译:可以翻译视频和播客等内容,使创作者和企业能够以流利且原汁原味的声音触达全球更多受众。 3. 服务全球:改善偏远地区的必要服务。 4. 帮助言语障碍人士:为言语障碍人士提供治疗应用,以及为有学习需求的人士提供教育增强功能,使残疾人能够进行交流。 5. 帮助病人恢复声音:帮助患有突发性或退行性言语障碍的患者恢复声音。
近日,Adobe 放了个大招,推出了这个 Adobe GenStudio 的神器。说实话,这简直就是咱们营销人的福音啊!以后做跨渠道活动,啥工具都不愁了,一站式搞定!
GenStudio 是基于生成式人工智能打造的,简单说,就是它懂你,知道你想要啥。用它来规划、制作、管理、发布和评估内容,那简直就是轻松加愉快。最关键的是,还能保证内容和品牌形象严丝合缝,不掉链子。
来说说它都有哪些牛X的功能吧:
1. 创作:有了 Adobe 的 AI 技术,咱们营销人也能秒变创作达人!快速出图,品质还高。而且都是基于品牌认证的模板,AI 护航,不怕品牌形象跑偏。 2. 内容中心:这个平台界面简洁明了,找素材、编辑、重复用、分享,全都方便得不行。再也不用东翻西找,浪费时间了。 3. 活动管理:GenStudio 还有个活动概览功能,活动简介、时间表一目了然。策划活动?那是分分钟的事! 4. 发布:更牛的是,GenStudio 还能和 Adobe Experience Cloud 的其他产品(比如 Journey Optimizer、Experience Manager、Marketo 和 Target)无缝对接,想导出到其他应用也是轻而易举。 5. 数据洞察:最后,还能实时看到内容在不同渠道的表现,AI 还能帮忙生成不同版本的内容,让活动效果更好。
Adobe GenStudio 试玩地址戳这里!
阿里通义千问迎来了一次重磅升级,其1000万字的长文档处理功能现已向所有人免费开放,这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起,无论是金融、法律、科研、医疗还是教育领域的专业人士,都可以通过通义千问的网站和APP,轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文,以及分析考试成绩和总结深度文章。
在金融领域,专业人士只需上传公司财报,通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息,帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后,通义千问还能生成公司在这一阶段内的业务变化、业绩趋势,并进行深入的财报分析。
在法律领域,通义千问同样展现出强大的能力。对于律师和法官而言,阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而,通义千问能够迅速阅读并分析这些法律文件,帮助用户迅速掌握法律条文的要点。输入特定案件信息后,通义千问还能给出相应的判罚建议,极大地提高了工作效率。
目前,通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用,展现出了其在智能科技领域的卓越实力。
微软推出了一项名为Mora的视频生成项目,该项目利用先进的Agents技术来尝试复原Sora的视频生成能力。目前,Mora已经能够基本还原Sora的所有功能,并可以生成分辨率为1024*576的12秒视频。
这些复原的能力包括:将文本直接转换为视频、根据特定的文本条件将图片转换成视频、扩展已有的视频内容、实现视频到视频的编辑、串联多个视频片段,以及模拟数字世界等。
项目简介:原文链接
Mora项目基于一种新型的多AI智能体框架,融合了多个尖端的视觉AI智能体,旨在复刻Sora所展示的强大的通用视频生成能力。Mora能够灵活运用这些视觉智能体,在各种任务中成功地模仿了Sora的视频生成技巧。
通过广泛的实验验证,我们发现Mora在这些任务上的表现已经与Sora相当接近。从整体性能上评估,Mora与Sora之间仍然存在一些差距。但是,我们仍对Mora项目寄予厚望,希望它能够引领未来视频生成技术的发展方向,并通过多AI智能体的协同工作实现更多的突破。
上个月 Stable Diffusion 的最新版本:Stable Diffusion 3 发布了,带来了文字渲染能力、多主题提示能力和图像质量的进一步提升。但是近日,Stable Diffusion 的核心研究团队宣布集体离职,尽管具体离职原因尚未公开,但据《福布斯》报道,Stable AI 公司可能因为财务困境而面临挑战。Stability AI 的未来发展和 Stable Diffusion 项目的前途,成为了业界关注的焦点。
- Stable Diffusion的核心研究团队成员,包括研究团队领导Robin Rombach、共同一作Andreas Blattmann和另一位作者Dominik Lorenz,已经集体辞职。
- Stability AI是Stable Diffusion项目的主要资助者,提供了必要的计算资源。该项目最初由慕尼黑大学和AI创业公司Runway共同完成。
- Stable Diffusion是一个文本到图像生成模型,因其免费开源而迅速走红,推动Stability AI在2022年的A轮融资中筹集到1.01亿美元,估值达到10亿美元。
- 由于Stable Diffusion的开放性,Stability AI的商业模式并不明确,导致公司难以稳定盈利。据报道,公司每月的运营成本高达800万美元。
- 去年年底,有关Stability AI可能因财务压力寻求出售的消息传出。CEO Emad Mostaque曾警告员工行业竞争激烈,并暗示他们可能在2023年面临困境。
如果真如上述所说,我们心心念念的 Stable Diffusion 3 是否还能保持开源呢?新闻源:点这里
小伙伴们,听说过Magnific AI这款神器吗?感觉比较适合平时喜欢P图的朋友,或者摄影师,当然了需要大量后期修图的设计师也可以试试。
最厉害的是,它能够将图像分辨率提升至最高1亿像素,支持最高放大16倍,达到10000×10000的分辨率。该工具不仅能够放大图像,还能根据用户的提示和参数添加或重构细节,使图像变得更加高清和细腻。
Magnific AI还提供了像素级AI重绘功能,通过魔法般的重绘图像细节和像素块,保证清晰度。
Magnific AI具有灵活的设置调整功能,支持输入提示词、提供Creativity、HDR、均衡等调整选项,以及针对人像、插画、游戏资产、自然风光、摄影、3D渲染等多种优化场景。
最近,Magnific AI的照片风格化功能上线了,可以将你的任意照片转换成你想要的任意风格,喜欢摄影的朋友,推荐一定要试一试。Magnific AI 官网
3月17日,特斯拉首席执行官(CEO)马斯克的AI创企xAI正式发布3140亿参数的混合专家模型Grok-1。xAI官方网站称,其遵照Apache 2.0协议开放模型权重和架构。
我给大家整理一下重点:
- 开源声明:xAI宣布其大模型Grok-1开源,并遵循Apache 2.0协议,模型权重和架构已在GitHub上公开。 - 模型规模:Grok-1是一个拥有3140亿参数的混合专家模型,成为目前参数量最大的开源大语言模型,超过了OpenAI GPT-3.5的1750亿参数。 - Grok-1的特点:Grok-1被描述为一个能够回答任何问题的AI,具有机智和叛逆的特点。它将用于自然语言处理任务,包括问答、信息检索、创意写作和编码辅助。 - 性能评估:Grok-1在HumanEval编码任务和MMLU中显示出强劲的性能,超过了包括ChatGPT-3.5和Inflection-1在内的所有其它模型。 - 社区反响:开源后,Grok-1在GitHub上迅速获得了9600星标,显示出社区的高度关注和支持。
另外,我个人觉得马斯克这项壮举对行业的影响也是巨大的,以下是一些个人见解:
1. 技术创新的加速:Grok-1的开源可能会加速AI技术的创新。由于模型权重和架构的开放,研究人员和开发者可以自由地访问、修改和扩展这个模型,从而推动新的研究和应用的开发。 2. 知识共享与协作:开源模型鼓励全球范围内的开发者和研究者共同参与到模型的改进和优化中来,促进知识共享和技术交流,有助于提升整个行业的技术水平。 3. 商业竞争格局变化:Grok-1的开源可能会改变现有的商业竞争格局,尤其是对OpenAI等其他AI研究机构和企业构成挑战。这可能会促使其他公司也采取更加开放的策略,以保持竞争力。 4. 安全性和伦理问题:开源AI模型也引发了关于安全性和伦理的讨论。一方面,开源可以增加技术的透明度,有助于发现和解决潜在的安全问题;另一方面,也可能增加模型被滥用的风险。 5. 教育和培训机会:Grok-1的开源为教育和培训提供了新的资源。学生和自学者可以直接访问和学习最先进的AI模型,这对于培养下一代AI人才具有重要意义。 6. 应用开发的多样性:开源模型使得个人和小型企业也能够利用先进的AI技术,这可能会导致更多创新的应用和服务的出现,增加市场的多样性。 7. 对开源与闭源的辩论:Grok-1的开源可能会加剧关于开源与闭源哪种模式更有利于AI发展的辩论。这将影响未来AI研究和商业化的路径选择。
大家对此有些什么看法,也可以评论区讨论哦~ 更多详细内容,可以看看 xAI官网!