一篇文章带你回顾2024年,AIGC 领域的重磅产品和新模型。
更多AIGC 干货:
「趋势」钉钉与 IDC 联合发布的《2024 AIGC 应用层十大趋势白皮书》。
「模型」大模型 Sora 发布。美国人工智能研究公司 OpenAI 正式对外发布人工智能文生视频大模型 Sora,该模型能够根据用户的文本提示创建最长 60 秒的逼真视频。
「产品」字节跳动推出的一站式 AI Bot 开发平台「扣子」正式发布;
「模型」谷歌发布 Gemini 大型语言模型。谷歌正式宣布将旗下 Bard AI 聊天机器人更名为 Gemini,并同步推出了专为安卓用户打造的 Gemini 应用。Gemini 是谷歌最新、最大规模且功能最为强大的大型语言模型,其发布进一步推动了 AIGC 在对话和搜索引擎集成 AI 领域的发展。
「模型」Claude3 模型发布。该模型是 Anthropic 发布的最新 AI 大模型系列,包括 Claude 3 Haiku、Sonnet 和 Opus 三种型号。该系列模型在设计时考虑了提高对各种问题的响应能力,特别是在处理复杂推理任务时表现出色。其中,Opus 模型在执行高级推理 任 务 时 的 表 现 优 于 OpenAI 的 GPT-4 和 谷 歌 的 Gemini Ultra。
「模型」北大团队联合兔展发布了 Open Sora 文生视频大模型。旨在通过文本输入生成视频内容。该模型是北大团队与兔展合作发起的 Sora 复现计划的一部分,提供了完整的视频生成解决方案,包括视频数据预处理、加速训练、推理等。
「模型」Yi-9B 大型语言模型。该模型是李开复旗下 AI 公司零一万物开发的,Yi-9B 是一款具有 90 亿参数的大型语言模型,特别加强了在代码和数学方面的学习能力。该模型在代码和数学能力上达到了前所未有的高度,同时保持了对消费级显卡的良好兼容性,为广大开发者和研究人员提供了前所未有的便利性和强大功能。
「模型」Stability AI 发布 SD3 大模型。采用了与 Sora 相同的 DiT(DiffusionTransformer)架构,生成的图像质量实现了显著提升。该模型支持多主题提示,并改进了文字书写效果。Stability AI 表示,Stable Diffusion 3 在基于人类偏好的评估中优于当前最先进的文本到图像生成系统。
「模型」苹果公司发布了 MM1 大型多模态基础模型 。MM1 是苹果公司最新发布的一款大型多模态基础模型,拥有 300 亿参数,采用了 MoE 架构。该模型是苹果在 AIGC 领域的重要布局之一,展示了苹果在 AI 技术方面的深厚积累和创新实力。
「模型」 生数科技发布 Vidu 视频生成大模型。生数科技发布了 Vidu 视频生成大模型,该模型融合了 Diffusion 与 Transformer 技术,开创性地创建了 UViT架构。Vidu支持一键生成长达16秒、分辨率1080P 的高清视频内容,展现了 AIGC 在视频生成领域的强大能力。
「模型」昆仑万维发布天工音乐大模型。昆仑万维推出了天工音乐大模型,这是中国唯一公开可用的音乐 AIGC 模型。该模型的 AI 人声合成技术达到了业内领先水平,为音乐创作和生成提供了全新的解决方案。
「模型」微软发布 Phi-4 移动端大模型。微软研究院发布了 Phi-4 移动端大模型,该模型延续了 Phi 系列的小参数模式,尽管只有 140 亿参数,但在多项基准测试中表现出色,甚至在某些方面超越了参数更多的模型。Phi-4 的发布展示了微软在移动端 AI 技术方面的实力。
「发布」OpenAI 发布 GPT-4o。OpenAI 发布了 GPT 4的迭代产品——GPT-4o,并宣布向所有用户开放。
这一消息的发布不仅提升了用户对 ChatGPT 的兴趣,也促使国内大模型产品开始考虑降价策略以应对竞争。GPT-4o 的发布进一步推动了生成式 AI 技术的发展,为用户提供了更高质量的服务、更有趣的对话体验以及更有用的信息。
「产品」即梦 AI 正式上线,提供图片生成和智能画布等功能。
「模型」阿里云在 AI 智领者峰会上发布了通义千问 2.5 版 本 , 并 开 源 了 1100 亿 参 数 模 型 Qwen1.5-110B。相较于 2.1 版,2.5 版本在理解能力、逻辑推理、指令遵循及代码能力上分别实现了 9%、16%、19%和 10%的提升。此外,通义还不断拓展其应用场景,新增了文生图、智能编码、文档解析、音视频理解等功能。
「模型」可灵 AI 发布可灵 1.5 模型,其产品被用于电影拍摄,九个导演已经用它拍完片子。
「产品」可灵宣布国际版 1.0 全球上线,同时国内版本也进行了基础模型的升级,并全面开放内测。
「模型」Flux.1 发布,包含专业版、开发者版和快速版三种模型。其中,专业版和开发者版在性能上击败了 SD3-Ultra 等主流模型,而快速版 FLUX.1 schnell也超越了 Midjourney v6.0、DALL·E 3 等更大的模型。
「产品」阿里通义 AI 实验室宣布,将在即将举行的云栖大会上推出一款创新视频生成大模型。该模型的预约通道已在通义 App 及通义万相 PC 平台上开放,但具体使用权限尚未向公众开放。这款大模型融合了“文生视频”与“图生视频”两大创意模式。
「模型」Flux 推出了 1.1 Pro 版本,并在 Beta 版中推出了 BFL API,进一步提升了模型的性能和易用性。
「模型」Stability AI 正式发布了其最新的 StableDiffusion 3.5 系列 AI 图像模型。与前一版本相比,Stable Diffusion 3.5 在现实感、提示依从性以及文本渲染质量方面均有显著提升。
「模型」2024 年 11 月,超清 AI 图像生成模型 FLUX1.1 Pro Ultra 发布,支持高达 4 兆像素的分辨率,生成速度大幅提升。
「工具」ComfyUI:启用了新 UI(Beta UI)作为默认界面,提升了用户体验。
「发布」OpenAI 12 天超长发布会。OpenAI 在 2024 年 12 月举办了一场为期 12 天的超长发布会,期间陆续发布了多款新产品和功能,包括完全体的 o1 推理模型、o1-mini 强化微调技术、Sora Turbo 视频生成版本 、Canvas 工作台 、ChatGPT 与 AppleIntelligence 的集成、高级语音模式、Projects 项目管理功能、升级后的 ChatGPT 搜索功能、o1 推理模型 API 开放、辩论游戏、Microscope 神经网络分析工具,以及新一代推理模型 o3。这些发布内容不仅展现了 OpenAI 在 AI 领域的创新实力,也为 AI 产业的未来发展指明了方向。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
这么设计才好玩
已累计诞生 661 位幸运星
发表评论 已发布7条
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓