前言
在过去的 30 天里,AI 圈又发生了哪些劲爆大事件?赶紧来看看我们精心整理的一手 AIGC 资讯和深度分析测评,我们的 AIGC 爆肝 30 天测评又和大家见面了。
继前两期 AIGC 测评文章发布之后,我们也收到了许多积极的反馈,对于还未阅读过的同学,欢迎通过以下链接直接访问浏览。
在本系列的第一章,我们还是会快速给大家概述下国内外 AI 圈领域的重要资讯和动态,第二章,除了既往介绍我们筛选后的重点实测产品以外,我们还将探讨和分析一些感兴趣的 AI 特定领域内容或者工具的对比研究,第二章会给大家详细介绍以下三个领域内容,首先是 GPT-4o 的功能详解,OpenAI 的扩张之路以及国内外 AI 大模型的未来趋势等;其次是“苹果智能”套件 Apple Intelligence 的功能亮点介绍,最后是对 AI 智能海报平台的深入研究和测评。
接下来,就让我们来看看近期 AIGC 圈子里发生的最新进展吧!
在本章中,我们将带您快速浏览 AI 圈近期发生的重要动态。为了确保信息的清晰度和易于消化,我们将这些事件按照国内和国际两个维度进行分类,并依次进行梳理。整体顺序为采集时随机排列,排名不分先后。
第 1 节:国内篇
第 2 节:国外篇
第 1 节:GPT-4o
① 介绍概览
② 产品实测
Gpt-4o 是一款由 OpenAI 开发的全新 AI 大模型,涵盖了文本、视频和音频领域的智能应用,我们将为大家详细介绍它的特点和应用场景。
首先,我们来看看 GPT-4o 与之前版本的区别。GPT-4o 于 2024 年 5 月 14 日发布,是一个跨文本、视频和音频领域的综合 AI 模型。通过下方的表格我们可以看到,与 OpenAI 之前发布的 GPT-4.0 和 GPT 4.0-Turbo 相比,GPT-4o 全面免费开放使用,大大降低了使用门槛;与此同时,它的主要优点表现在更快速、更智能、以及更强大,接下来,我们开一一展开说明。
更快速的响应速度
GPT-4o 在响应速度上有了显著提升。通过摄像头和麦克风等设备,它能够实时获取图像和声音信息,并在毫秒级别进行处理和反馈。例如,这个例子显示出,它可以为视障人士提供实时的环境描述服务,充当他们的“眼睛”。此外,GPT-4o 在回答问题时非常迅速,平均响应时间仅为 232 毫秒(人类对话的平均反应速度是 320 毫秒),让用户体验更加流畅。
更智能的情感交互
GPT-4o 不仅速度快,还更加智能。它具备模拟和理解人类情感的能力,能够在情感层面与用户互动。这意味着在与用户交流时,它可以实时读懂并回应情绪。例如,在识别实时场景后,它可以为用户唱生日歌,情感丰富、声情并茂。此外,它对非英语类语言的理解和运用能力也有了显著提升,能够流畅地进行多语言互动。
更强大的设备集成
GPT-4o 首次推出了电脑客户端,实现了与用户电子设备的深度融合。这不仅使其不再局限于网页版,还能够直接处理用户电脑上的网页信息、办公内容和随时提出的问题。比如,在办公场景中,它可以循循善诱地教学数学题,抑或主持多人会议并记录会议备忘。
2024 年高考实测
另一个实测案例也非常有趣。在今年高考落幕后,上海人工智能实验室使用其司南评测体系 OpenCompass,选取 GPT-4o 和其他 6 个开源模型,进行高考“语数外”全卷能力测试。
在这场测试中,GPT-4o 获得了第二名的成绩。得分情况显示,GPT-4o 在语文和英语方面成绩突出,尤其是对语文的现代文理解能力较强,而英语则存在因为作文超出字数限制而扣分的情况,和人类考生往往因为字数不足而扣分的情况相反;但在数学方面还存在一定的挑战,和其它大模型一样没有及格,测试显示出,这些大模型在数学主观题回答普遍比较凌乱,甚至出现过程错误但结果正确的情况。这次高考测试显示了 GPT-4o 在语言理解和生成方面的强大能力,同时也指出了 AI 在数学推理领域的改进空间。
OpenAI 与传媒界的博弈
作为一颗在人工智能领域冉冉升起的新星,OpenAI 面对的挑战与争议从未停歇。一直以来,AI 公司们在训练 AI 模型时非法使用新闻内容的举动引发了新闻业的担忧与抗议,以《纽约时报》为代表的多家新闻机构正在向 OpenAI 提起诉讼,指控其 AI 工具侵犯版权。但与此同时,OpenAI 也在想方设法改变自己的处境,积极探寻扩张之路。
(来源:证券时报网 https://www.stcn.com/article/detail/1213775.html )
5 月 22 日,OpenAI 宣布和新闻集团(News Corp)宣布达成多年期协议,OpenAI 将可以访问新闻集团主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《纽约邮报》《泰晤士报》《太阳报》等在内的众多媒体。
OpenAI 有权在 ChatGPT 中显示新闻集团旗下媒体的内容,来回答用户的问题,增强其产品能力;除了提供内容外,新闻集团还将分享新闻专业知识,以帮助确保在 OpenAI 的产品中达到最高的新闻标准。两家公司并未透露签约此次协议的具体金额。不过据外媒报道,新闻集团将在五年内获得 OpenAI 支付的 2.5 亿美元,其中包括现金和使用 OpenAI 技术的信用额度。
越来越多的媒体公司和机构“牵手”OpenAI,授权后者使用其资料库来训练 AI 模型。今年以来,OpenAI 已经与美国、英国、德国、法国、西班牙等国家的媒体达成了协议。当然,OpenAI 需要给这些公司或机构支付不菲的授权费用。
OpenAI 与 Apple 的联手
在与传媒界周旋的同时,OpenAI 也在为自身应用的落地载体开辟更广阔的道路。
6 月 11 日,OpenAI 与苹果官宣合作。ChatGPT 将被深度集成在苹果产品矩阵中,包括最新的 iOS、iPadOS 和 macOS。用户无需在工具之间跳转即可访问 ChatGPT,包括图像和文档理解功能。
Siri 也可以随时利用 ChatGPT 的专业回答。此外,Apple 系统范围内的写作工具也可以用到 ChatGPT,从而帮助用户生成内容。通过 Compose,用户也可以访问 ChatGPT 图像工具来生成各种风格的图像。
OpenAI 的竞品动态:微软
市场上的竞争者也在积极推进他们的 AI 产品。例如,5 月 21 日,微软发布了搭载 Windows 11 版本的 Surface Pro 10 和 Surface Laptop 6,集成了 Bing Chat 和 GPT-4 的 Copilot 功能,它们成为微软首批 AIPC 产品,性能与效率可媲美苹果 iPad Pro、MacBook Pro。
Windows 11 更新版推出了 AI 功能,对一些操作系统中的基础功能进行 AI 升级,包括画图(Point)、视频编辑器(Clichamp)、截图工具(Snipping Tool)和照片、实时字幕和翻译功能,以及一项微软内部称之为“AI Explorer”的新功能。
“AI Explorer”被看作是一个“升级版 Copilot”,内置历史/时间轴功能,用户在电脑上所有活动都将转化为可以用自然语言搜索的时刻(moment)。该功能适用于所有应用程序,用户可以通过该功能直接搜索之前打开的对话、文档、网页与图片。例如,用户可以输入“找一下上次李梅说她喜欢哪些餐厅”,AI Explorer 就会显示出李梅之前提到这些餐厅时的确切对话。
第 2 节:Apple Intelligence
① 介绍概览
② 产品实测
面对来势汹汹的微软、OpenAI 和谷歌——这些已在人工智能领域崭露头角的对手,苹果也奋起直追。北京时间6月11日,苹果WWDC2024发布会终于揭开面纱。除了常规的系统更新外,传闻已久的“Apple Intelligence”——“苹果智能”套件,以及与OpenAI的合作也终于在世人面前亮相。
根据发布会介绍,Apple Intelligence 是苹果的全新个性化智能系统,全面接入了生成式 AI 的能力。Apple Intelligence 结合生成式 AI 模型和使用者的个人资料,提供实用的智能服务。它覆盖 iPhone、iPad 和 Mac,深度集成在 iOS 18、iPadOS18 和 macOS Sequoia 中。它利用苹果芯片的能力来理解并创造语言和图像,可以跨应用地执行操作,并利用个人信息简化和加速日常任务。
由于发布会的信息内容量比较大,在此我们为大家简单总结一下本次苹果发布会关于 Apple Intelligence 的主要功能。
脱胎换骨的 Siri
- 更丰富的语言理解能力,变得更加自然、更懂上下文、更个性化,能够简化和加速日常任务;
- 能够理解用户在说话时的犹豫,并在不同请求之间保持上下文连贯;
- 支持打字与 Sir 交流,并可以在文本和语音之间切换;
- 全新的设计,当 Siri 处于激活状态时,屏幕边缘会环绕着优雅的发光效果。
更强的语言理解和创造能力
- 全新的系统级写作工具支持在任何写作场合重写、校对和总结文本,包括邮件、备忘录、页面以及第三方应用程序
- 重写功能:用户可以从多个版本中挑选,调整文风以适应不同的读者和场合;
- 校对功能:深入检查语法、词汇和句式结构,并提供建议性的编辑意见及其解释,让用户轻松审查或快速采纳;
- 总结功能:允许用户选取文本,一键生成简洁明了的段落、要点列表、表格或清单,使信息一目了然。
更自由的可视化表达
1)更便捷的照片和视频搜索能力:用户可以使用自然语言直接搜索特定照片;
2)更强大的视频剪辑能力:用户能够在剪辑中找到特定时刻,并直接跳到相关片段。此外,全新的「Clean Up」工具可以识别并移除照片背景中的干扰物体,而不会改变主体;
3)Image Playground 应用:用户可以在几秒钟内创建动画、插图或素描三种风格的图像。用户还可以通过 Apple Pencil 工具调板中的新 Image Wand 访问 Image Playground,使笔记更具视觉吸引力。粗略的草图可以变成令人愉悦的图像,用户甚至可以选择空白空间,利用周围区域的背景来创建图像;
4)Genmoji:苹果系统将支持创建原创的 Genmoji 来表达想法,只需输入描述,符合要求的 Genmoji 就会出现,并附带其他选项。用户甚至可以根据照片为朋友和家人创建 Genmoji。就像表情符号一样,Genmoji 可以内嵌添加到消息中,也可以作为贴纸进行分享。
苹果近一个月股价走势,来源:Wind
以上就是本次苹果发布会中有关 Apple Intelligence 的主要亮点。发布会结束的当天,苹果股价下跌 1.91%,然而第二天,苹果股价大涨 7.26%,市值大增 2142 亿美元,创下历史新高,近期股价最高曾达 220.2 美元。由此可见,市场对苹果还是抱有较乐观的期望的。
第 3 节:AI 智能海报平台
① 介绍概览
AIGC 最近已经渗透到工作中的各个方面,以工作中常见的海报制作为例,有哪些 AI 能力介入?最终呈现效果如何?接下来让我们从“可画”这个业界翘楚的使用中一探究竟。
② 产品实测
首先,基于设计主题检索和确定要使用的海报模板。下图以母亲节为例——在检索框输入“母亲节”,即可在诸多的主题海报中找到心仪的模板。
其次,为了和竞品海报拉开差异以及彰显个性化,用户会替换模板中的主体素材。在 AI 出现之前,我们除了导入版权素材,就只能自行设计;在 AI 出现之后,我们可以输入提示词,让 AI 来生成图片素材。像使用 Midjourney 一样,不满意就重新生成,直到选出满意的生成效果为止。
再者,对主体素材可以做进一步的调整,如 AI 抠图、加各种滤镜等。主画面完成后,需要精准控制的 logo、文案、二维码等元素,可以直接进行替换并调整大小、位置、字号、字色等。
最后,一个正常的海报制作就基本完成了。可画对于文案部分,也引入了 AI 功能——魔力快写,让用户可以对现有文本进行续写、缩写、重写等。
③ 产品评价
可画是一个平台级产品,涵盖了各种规格的设计物料制作,此处我们以海报制作为例,管中窥豹,旨在分析现阶段 AI 在设计实操上的表现,一句话概括就是——现阶段对于海报设计,AI还不能一步到位直接生成海报结果,而是把细碎的AI能力穿插在图片生成、图片处理、文案处理等不同阶段。同样,国内同类竞品稿定( www.gaoding.com )也是一样的解题思路,因为稿定的 AI 能力和实际效果与可画大致相同,就不再赘述,感兴趣的童鞋可以自行体验。
然后以可画为代表的 AI 智能海报平台具体效果如何?我们分别来看:1.AI 生图——效果一般,不及MIdjourney,推测是只能选择国内过审的文生图模型;无法添加各自定制化的Lora,如各自吉祥物Lora模型;2.AI修图——有的不错,有的不行。和世面上的现状大差不差,抠图、变高清、去水印等效果不错;局部重绘和扩图等功能就很拉胯;3.AI文案——比一般人能写,能力不及编辑。综上,现在的AI智能海报平台最拿手的还是基于海量模板,给非设计类人员用比较出色。基于AI能力做定制画海报,还需要让子弹再飞一会儿。
以上就是本次 AIGC 测评的全部内容了,希望除了快速了解 AI 圈的大事件以外,还希望能够为同学们带来一些启发和新思路。如果本期的内容大家还没有看过瘾的话,一定要继续关注我们,我们会持续追踪 AIGC 的最新进展并在第一时间发布独家深度测评,大家的关注和互动会是我们持续更新的动力。同学们,我们下期见!
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
AI绘画创意与实战
已累计诞生 655 位幸运星
发表评论 已发布5条
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓