今天凌晨,微软带来了一系列重磅产品,一口气发布了 50 多项更新。
发布会上,微软 CEO Satya Nadella 谈到了关于现代计算的两个梦想。一个是计算机是否可以理解我们,而不是我们必须理解计算机?第二个是在这个信息不断增加的世界里,计算机能否帮助我们根据所有这些信息进行推理、规划和更有效地采取行动? 从 AI 基础设施的搭建,到模型产品的落地,微软在寻找答案的过程中,逐渐成长为一个全方位的 AI 解决方案提供商。今夜过后,或许我们都得重新审视微软这个巨头。
发布会要点速览: 1、Team Copilot ,从个人助理变成团队助理 2、全新的 Agent 代理功能 3、Phi-3 家族迎来新成员 4、Azure AI Studio,包含 API 集成、完整的工具链及部署全家桶 5、Fabric 大升级,推出实时智能(real-time intelligence) 6、专为云端规模化应用性能优化的 Cobalt 芯片
发布会更多详情:https://mp.weixin.qq.com/s/MoHPci4JAb25ifDhMwUWiQ
现在,你可以像和 ChatGPT 聊天一样使用谷歌地图了。
谷歌地图最新升级包括以下 5 点: 1. 对话式地图搜索 直接与 Google Maps 聊天搜索信息,AI 将使用 Google Maps 上的商户信息、照片、评分和评论等信息来提供可信的结果。
2. 实时查看地图 只需点击相机图标即可使用实时视图进行搜索。谷歌地图会显示附近的 ATM、餐厅、公园和公交站,并显示其开放时间和评级,且跟随 AR 箭头,准确引导您到达目的地。
3. 全新沉浸式视图 在正式访问地点之前先确定其范围,查看逼真的视图,并获取天气预报、高峰时段等有用信息,而且还能查看室内景观。比如在订餐时可以展现餐厅氛围,帮助您选择。
4. 新增多重搜索 现在,您可以结合文字和图像, 在 Google 地图上访问数百万本地企业的信息。
5. 获取人工智能建议 随时随地获取人工智能支持的建议。如果开始下雨,可以向地图询问“雨天活动”并获取附近的喜剧表演或电影院等建议。
2024 春季火山引擎 Force 原动力大会大家看了吗?放大招了,火山引擎第一次正式亮相了豆包大模型家族,一口气直接祭出了9个成员。
以下是大会的重点信息概要:
1. 核心模型:豆包通用模型分为两个尺寸,大杯(Pro)和中杯(Lite),其中Pro版本窗口尺寸最大可达128K,全系列可精调;Lite版本响应速度快。 2. 价格优势:豆包通用模型Pro的价格远低于行业标准,小于32K窗口尺寸的价格为0.0008元/千tokens,128K窗口尺寸为0.005元/千tokens。 3. 使用量:豆包大模型自上线以来,每天处理的token数量高达1200亿,生成图片数量为3000万张。 4. 多场景应用:豆包大模型在抖音、今日头条等50多个场景中进行实践和验证。 5. 文本对话与语音功能:豆包大模型在文本对话和语音合成方面表现出色,提供了更自然、更像人的声音效果。 6. 角色扮演模型:豆包大模型还包括角色扮演模型,允许用户与虚拟角色进行对话。 7. AI应用开发平台:火山引擎还发布了一站式AI应用开发平台“扣子(coze)”,支持用户通过简单的操作来创建智能体。 8. 火山方舟2.0:火山引擎的MaaS平台火山方舟升级到2.0版本,提供一站式服务,让企业可以快速落地大模型应用。 9. 安全性与稳定性:火山方舟在算力、算法和安全层面提供了优化方案,包括GPU资源池、SFT训练引擎和安全沙箱等。 10. 差异化插件:火山引擎提供了联网插件、内容插件和RAG知识库插件,以提供差异化服务。 11. 战略差异:火山引擎的战略与其他大模型厂商不同,更注重实际使用量和用户体验,而不是仅仅依赖榜单分数和参数规模。 12. 市场反馈:豆包APP累计下载量超过1亿,火山引擎与多个行业的企业合作,共同优化大模型。 13. 总体评价:火山引擎的大模型以更大的使用量、更低的价格、更多的应用场景、更人性化和智能化的特点,展示了其在大模型时代的竞争力。
小编觉得本次大会最吸引我的当属这个文本对话语音功能了,很逼真了,大家可以一起感受一下:(右键视频-显示控件-可以打开声音)
更多介绍可以戳这里: 2024 春季火山引擎 Force 原动力大会
昨晚 OpenAI 发布了 GPT-4o 后,压力就给到了 Google I/O ,现在给我说 OpenAI 不是故意的,我都不信!
这场发布会体现了 Google 在 AI 领域的深厚技术积累和对未来技术趋势的洞察,同时也表明了 Google 将 AI 技术深度融合到其产品生态中的决心。
以下是发布会的一些重点概述:
发布会要点: 1、Google Search AI:发布了 AI Overviews,加强版 AI 搜索概要功能,多步推理能力上架。 2、Gemini 大模型:Gemini 1.5 Flash(100 万上下文);Gemini Pro(200 万上下文)。 3、Gemma 大模型:发布开源多模态大模型 Pali Gemma 和 Gemma2。 4、AI in Google Workspace:用 Gemini 的能力和 Side Panel 的形式,将 Google 系列产品串在一起。 5、Gemini App:手机版的 Gemini 应用程序,即将支持和 AI 视频对话,近几周发布。 6、Project Astra:最新的多模态 AI 项目,包含 Imagen3、 Music AI Sandbox 和 Veo 等针对图像、音乐、视频的生成式 AI。
更多关于2024 谷歌I/O大会 的介绍及点评,大家可以看看这篇文章,总结的非常详细:Google I/O 2024
太震撼了啊,没等到GPT-5,却迎来了 OpenAI 新旗舰模型GPT-4o!
5月14日凌晨,GPT-4o 在 OpenAI 官网正式发布了,GPT-4o是一个多模态模型,能够处理视频、音频和文本数据,具有实时推理的能力。它能够执行多种任务,包括实时翻译、唱歌、做数学题和讲笑话等。GPT-4o的语音响应时间非常短,平均响应时间为320毫秒,并且在MMLU评测中创下了88.7%的新高分,超过了其他市面上的大模型。
这是正儿八经的原生多模态,更重要的是可以实时推理音频、视觉和文本,注意这里是实时,实时,实时,推理的不是文本,是音频!视觉!
某种程度上,AGI 已然成为现实,我们即将迎来一个新的时代啊!
哈哈,我发现了一个超级逗趣的AI小游戏,《换你来当爹》!这游戏太神奇了,剧情和图片都是AI根据LLM的情节现场打造的,玩得时候简直像是在看好莱坞大片,效果炸裂,比起那些人工制作的游戏也毫不逊色!
但这游戏的卖点,可不仅仅是高质量哦!最厉害的是,它的剧情可以无穷无尽,你的“好大儿”的成长道路总是千变万化,绝不重复。想象一下,你可以把那个总惹麻烦的室友、脚臭得能让人昏厥的发小,还有那个一天到晚放屁的同桌,统统收入麾下,变成你的“乖儿子”。通过你的悉心“调教”,他们会眼泪汪汪地喊出:“爸爸,您辛苦了!”是不是感觉人生巅峰就在此刻?
别忘了,你也要像个真正的老爸一样对他们的行为作出回应。是请他们吃“竹笋炒肉”,还是温柔地讲道理,都会影响他们的“孝顺值”。游戏结束时,还有一份超详细的“生涯统计”等你查收,看看你的“育儿”成果如何。
我猜,这种寓教于乐、互动满满的游戏方式,说不定就是陪伴式AI的下一个大热门。更多的玩法,更低的上手和消费难度,这不就是我们梦寐以求的娱乐体验吗?赶紧来试试,看你能不能成为“最佳虚拟老爸”!
这里领取你的孝子,来了都是爹: https://lipu.badiya.cn/
设计师们,最近有个超级给力的AI工具你们一定不能错过,那就是刚刚更名为“即梦”的剪映Dreamina!这个全新的品牌不仅名字梦幻,功能更是强大到不行。
如果你经常需要为了找灵感、作图、处理图片而烦恼,那“即梦”绝对是你的救星。它支持将你的文字描述直接转化成图片,就像变魔术一样,把你脑海中的创意呈现出来。再也不用为了找不到合适的图片而发愁了!
而且,它的智能画布功能简直太神奇了。你可以轻松抠图、重组图像,甚至根据提示词重新绘制新的图像。这简直就是设计师的福音啊,再也不用为了修图、抠图熬夜加班了。
更厉害的是,它还能将你的文字描述转换成视频!你没听错,就是直接生成视频。如果你想做视频内容,但是又不懂剪辑、特效,这个功能简直就是你的大救星。只需要输入文字,就能生成一段精彩的视频,还支持利用图片作为基础,通过AI智能生成视频内容。这简直就是视频创作的新时代啊!
如果你们还在为作图、修图、视频剪辑而烦恼,那就赶紧试试“即梦”吧!它绝对会让你们爱不释手的!
线上体验地址:https://jimeng.jianying.com/ai-tool/video/generate
随着AI生成内容的广泛应用,大家是不是越来越难以区分AI和人类创作的内容?
5月8日,OpenAI在官网宣布,将推出面向其文生图模型DALL·E 3 的内容识别器,以及一个媒体管理器,这个识别器可以帮助开发人员快速识别内容的真假。
而且,这次ChatGPT的内容也有所改进:OpenAI最近在ChatGPT生成的内容中加上了原始网站链接,以保护知识产权并增加内容的可信度。
以下是案例:达拉斯最适合午夜约会的5家餐厅。ChatGPT会在回答的每一条内容上加上餐厅的官网地址。
更多详细的介绍戳这里:原文地址