2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

2024/12/31 推荐： Infinite AI阅读 2.1w 评论有奖阅读本文需 8 分钟

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

一篇文章带你回顾2024年，AIGC 领域的重磅产品和新模型。

更多AIGC 干货：

爆肝2W字！用奶奶都能看懂的文字带你了解AIGC的前世今生

大家好，我是言川。

阅读文章 >

一月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「趋势」钉钉与 IDC 联合发布的《2024 AIGC 应用层十大趋势白皮书》。

二月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」大模型 Sora 发布。美国人工智能研究公司 OpenAI 正式对外发布人工智能文生视频大模型 Sora，该模型能够根据用户的文本提示创建最长 60 秒的逼真视频。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「产品」字节跳动推出的一站式 AI Bot 开发平台「扣子」正式发布；

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」谷歌发布 Gemini 大型语言模型。谷歌正式宣布将旗下 Bard AI 聊天机器人更名为 Gemini，并同步推出了专为安卓用户打造的 Gemini 应用。Gemini 是谷歌最新、最大规模且功能最为强大的大型语言模型，其发布进一步推动了 AIGC 在对话和搜索引擎集成 AI 领域的发展。

三月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」Claude3 模型发布。该模型是 Anthropic 发布的最新 AI 大模型系列，包括 Claude 3 Haiku、Sonnet 和 Opus 三种型号。该系列模型在设计时考虑了提高对各种问题的响应能力，特别是在处理复杂推理任务时表现出色。其中，Opus 模型在执行高级推理任务时的表现优于 OpenAI 的 GPT-4 和谷歌的 Gemini Ultra。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」北大团队联合兔展发布了 Open Sora 文生视频大模型。旨在通过文本输入生成视频内容。该模型是北大团队与兔展合作发起的 Sora 复现计划的一部分，提供了完整的视频生成解决方案，包括视频数据预处理、加速训练、推理等。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」Yi-9B 大型语言模型。该模型是李开复旗下 AI 公司零一万物开发的，Yi-9B 是一款具有 90 亿参数的大型语言模型，特别加强了在代码和数学方面的学习能力。该模型在代码和数学能力上达到了前所未有的高度，同时保持了对消费级显卡的良好兼容性，为广大开发者和研究人员提供了前所未有的便利性和强大功能。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」Stability AI 发布 SD3 大模型。采用了与 Sora 相同的 DiT（DiffusionTransformer）架构，生成的图像质量实现了显著提升。该模型支持多主题提示，并改进了文字书写效果。Stability AI 表示，Stable Diffusion 3 在基于人类偏好的评估中优于当前最先进的文本到图像生成系统。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」苹果公司发布了 MM1 大型多模态基础模型 。MM1 是苹果公司最新发布的一款大型多模态基础模型，拥有 300 亿参数，采用了 MoE 架构。该模型是苹果在 AIGC 领域的重要布局之一，展示了苹果在 AI 技术方面的深厚积累和创新实力。

四月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」生数科技发布 Vidu 视频生成大模型。生数科技发布了 Vidu 视频生成大模型，该模型融合了 Diffusion 与 Transformer 技术，开创性地创建了 UViT架构。Vidu支持一键生成长达16秒、分辨率1080P 的高清视频内容，展现了 AIGC 在视频生成领域的强大能力。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」昆仑万维发布天工音乐大模型。昆仑万维推出了天工音乐大模型，这是中国唯一公开可用的音乐 AIGC 模型。该模型的 AI 人声合成技术达到了业内领先水平，为音乐创作和生成提供了全新的解决方案。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」微软发布 Phi-4 移动端大模型。微软研究院发布了 Phi-4 移动端大模型，该模型延续了 Phi 系列的小参数模式，尽管只有 140 亿参数，但在多项基准测试中表现出色，甚至在某些方面超越了参数更多的模型。Phi-4 的发布展示了微软在移动端 AI 技术方面的实力。

五月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「发布」OpenAI 发布 GPT-4o。OpenAI 发布了 GPT 4的迭代产品——GPT-4o，并宣布向所有用户开放。

这一消息的发布不仅提升了用户对 ChatGPT 的兴趣，也促使国内大模型产品开始考虑降价策略以应对竞争。GPT-4o 的发布进一步推动了生成式 AI 技术的发展，为用户提供了更高质量的服务、更有趣的对话体验以及更有用的信息。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「产品」即梦 AI 正式上线，提供图片生成和智能画布等功能。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」阿里云在 AI 智领者峰会上发布了通义千问 2.5 版本，并开源了 1100 亿参数模型 Qwen1.5-110B。相较于 2.1 版，2.5 版本在理解能力、逻辑推理、指令遵循及代码能力上分别实现了 9%、16%、19%和 10%的提升。此外，通义还不断拓展其应用场景，新增了文生图、智能编码、文档解析、音视频理解等功能。

六月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」可灵 AI 发布可灵 1.5 模型，其产品被用于电影拍摄，九个导演已经用它拍完片子。

七月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「产品」可灵宣布国际版 1.0 全球上线，同时国内版本也进行了基础模型的升级，并全面开放内测。

八月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」Flux.1 发布，包含专业版、开发者版和快速版三种模型。其中，专业版和开发者版在性能上击败了 SD3-Ultra 等主流模型，而快速版 FLUX.1 schnell也超越了 Midjourney v6.0、DALL·E 3 等更大的模型。

九月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「产品」阿里通义 AI 实验室宣布，将在即将举行的云栖大会上推出一款创新视频生成大模型。该模型的预约通道已在通义 App 及通义万相 PC 平台上开放，但具体使用权限尚未向公众开放。这款大模型融合了“文生视频”与“图生视频”两大创意模式。

十月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」Flux 推出了 1.1 Pro 版本，并在 Beta 版中推出了 BFL API，进一步提升了模型的性能和易用性。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」Stability AI 正式发布了其最新的 StableDiffusion 3.5 系列 AI 图像模型。与前一版本相比，Stable Diffusion 3.5 在现实感、提示依从性以及文本渲染质量方面均有显著提升。

十一月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「模型」2024 年 11 月，超清 AI 图像生成模型 FLUX1.1 Pro Ultra 发布，支持高达 4 兆像素的分辨率，生成速度大幅提升。

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「工具」ComfyUI：启用了新 UI（Beta UI）作为默认界面，提升了用户体验。

十二月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

「发布」OpenAI 12 天超长发布会。OpenAI 在 2024 年 12 月举办了一场为期 12 天的超长发布会，期间陆续发布了多款新产品和功能，包括完全体的 o1 推理模型、o1-mini 强化微调技术、Sora Turbo 视频生成版本、Canvas 工作台、ChatGPT 与 AppleIntelligence 的集成、高级语音模式、Projects 项目管理功能、升级后的 ChatGPT 搜索功能、o1 推理模型 API 开放、辩论游戏、Microscope 神经网络分析工具，以及新一代推理模型 o3。这些发布内容不仅展现了 OpenAI 在 AI 领域的创新实力，也为 AI 产业的未来发展指明了方向。