大白(●—●) 邀你回答

2024/04/25

苹果也加入AI革新浪潮了，OpenELM 大模型开源，大模型领域会迎来新风向吗？

4月24日，苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3 Mini类似，是一款专门针对手机等移动设备的模型。

以下是一些重点信息的摘要：
1. 开源OpenELM: 苹果公司开源了一个名为OpenELM的大语言模型，这与微软开源的Phi-3 Mini类似，是专为移动设备设计的模型。
2. 模型参数: OpenELM提供了四种不同参数规模的模型，分别是2.7亿、4.5亿、11亿和30亿参数。
3. 功能: 该模型能够执行生成文本、代码、翻译、总结摘要等功能。
4. 预训练数据: 尽管最小的模型只有2.7亿参数，但苹果使用了1.8万亿tokens的数据进行预训练，这是其小参数下仍能表现出色的原因之一。
5. 深度神经网络库CoreNet: 苹果同时开源了用于训练OpenELM的深度神经网络库CoreNet，该库在开源后不久就在GitHub上获得了超过1100个星标。
6. 苹果的开源策略: 苹果通常在手机领域采取闭源策略，但此次开源可能是为了吸引用户，未来可能会推出闭源产品实现商业化。
7. 技术贡献: 苹果不仅发布了模型权重和推理代码，还发布了完整的训练和评估框架，包括数据准备、模型训练、微调和评估流程，以及多个预训练检查点和训练日志。
8. OpenELM架构: OpenELM的架构，包括其技术创新点，如无编码器的transformer架构、层级缩放策略、不使用全连接层中的可学习偏置参数等。
9. 训练流程与数据集: 苹果使用CoreNet作为训练框架，Adam优化算法，以及动态分词和数据过滤的方法。

开源地址：https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca?ref=maginative.com
CoreNet地址：https://github.com/apple/corenet?ref=maginative.com
论文地址：https://arxiv.org/abs/2404.14619

OpenELM 人工智能大模型开源免费苹果设计

收藏 关注问题 点赞 9

立即查看大模型的解决方案

一键收藏！8 款 Stable Diffusion 优质模型推荐！

AIGC AI绘画阅读 2.0w

查看详情

优设问答有问必答 👉 回答问题赢奖品

17分钟阅读

8分钟阅读

4分钟阅读

10分钟阅读

5分钟阅读

{{comTitle}} {{comSubtitle}}

菜单 优设网uisdc.com 优设网 - 学设计上优设

您还未登录

登录后即可体验更多功能

大白(●—●) 邀你回答

立即查看 大模型 的解决方案

AIGCAI绘画阅读 2.0w

Wo~本文的评论还空着，快来抢沙发

邀你回答

求一个医美行业的UI设计参考网站，感谢！

< 上一篇

9.0k 设计师围观了该问题

沪上阿姨品牌形象大变身！从“上海阿姨”到“时尚姐姐”，新Logo亮相，你觉得新形象如何呢？

下一篇 >

土拨鼠

陈子木

酸梅干超人

程远

陈子木

优设读报 2025年03月26日 星期三

DeepSeek-V3 低调发布，允许用户免费下载和商业使用

阿里推出全新多模态模型 Qwen2.5-VL-32B:兼顾视觉语言与数学推理

OpenAI 更新语音助手功能，让对话更自然流畅、减少打断频率

PiT 框架惊艳亮相：图片碎片秒变完整图像

微信小店调整政策：严禁 AI 商业课程，倡导技术分享

近期热门问题

网友提问：入职一个月后有了更好的offer，该怎么提离职？

8位设计师参与回答

设计师们，分享一下你现在每天坚持做的事情？

8位设计师参与回答

上班后，感觉属于自己的时间越来越少了？

7位设计师参与回答

优设桌面摆件，IP小黄鸡原创桌面立牌上新啦！

7位设计师参与回答

大家觉得互联网公司什么团建最有趣？

7位设计师参与回答

大家没灵感的时候都在干什么？

7位设计师参与回答

优设官方微信群

添加管理员 招财

微信号: 扫码添加

严格审核打造高质量交流群