优设问答你的职场经验书

大白(●—●) 邀请你来回答

2024/04/25

苹果也加入AI革新浪潮了,OpenELM 大模型开源,大模型领域会迎来新风向吗?

4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3 Mini类似,是一款专门针对手机等移动设备的模型。

以下是一些重点信息的摘要: 1. 开源OpenELM: 苹果公司开源了一个名为OpenELM的大语言模型,这与微软开源的Phi-3 Mini类似,是专为移动设备设计的模型。 2. 模型参数: OpenELM提供了四种不同参数规模的模型,分别是2.7亿、4.5亿、11亿和30亿参数。 3. 功能: 该模型能够执行生成文本、代码、翻译、总结摘要等功能。 4. 预训练数据: 尽管最小的模型只有2.7亿参数,但苹果使用了1.8万亿tokens的数据进行预训练,这是其小参数下仍能表现出色的原因之一。 5. 深度神经网络库CoreNet: 苹果同时开源了用于训练OpenELM的深度神经网络库CoreNet,该库在开源后不久就在GitHub上获得了超过1100个星标。 6. 苹果的开源策略: 苹果通常在手机领域采取闭源策略,但此次开源可能是为了吸引用户,未来可能会推出闭源产品实现商业化。 7. 技术贡献: 苹果不仅发布了模型权重和推理代码,还发布了完整的训练和评估框架,包括数据准备、模型训练、微调和评估流程,以及多个预训练检查点和训练日志。 8. OpenELM架构: OpenELM的架构,包括其技术创新点,如无编码器的transformer架构、层级缩放策略、不使用全连接层中的可学习偏置参数等。 9. 训练流程与数据集: 苹果使用CoreNet作为训练框架,Adam优化算法,以及动态分词和数据过滤的方法。

开源地址:https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca?ref=maginative.com CoreNet地址:https://github.com/apple/corenet?ref=maginative.com 论文地址:https://arxiv.org/abs/2404.14619

好问题 9 回答 2

首席爆料师 邀请你来回答

2024/04/22

恐怖谷效应你听说过吗?在设计中追求真实的同时,如何巧妙避开“恐怖谷效应”?

小时候,大家肯定都听到过很多关于“鬼打墙”、“半夜鬼叫”的故事,每次听到都会让人毛骨悚然。👻

直到最近,我才知道这其实也是“恐怖谷效应”的一个体现!简单来说,就是当某些事物(如机器人、仿真玩偶等)与人类相似度很高,但在某些细节上又有微妙差异时,人们会感到极度的不安和恐怖。😨

大家有没有过这种经历?在商场看到那些超级逼真的硅胶娃娃,刚开始觉得好奇,但多看几眼后就会有种莫名的恐惧感。😖

我记得小时候有个仿真度很高的玩偶,初看很可爱,但晚上关灯后,那微微发光的眼睛仿佛在黑暗中盯着我,真的吓到我了!😱

所以说,“恐怖谷效应”真的很神奇,也提醒我们,在设计中追求真实的同时,也要注意不要越过那个“恐怖”的临界点!😉

如今,随着AI技术的进步,机器人和虚拟形象越来越接近真人。这种高度的仿真,一方面让我们感叹科技的神奇,另一方面,是否也触及到了“恐怖谷”的边缘?🤖

想象一下,当你与一个高度仿真的AI聊天机器人对话,它几乎可以模拟人类的情感反应,但在某些细节上又显得那么不自然,这种感觉,是否会让你心生恐惧?😖

2.9k 设计师围观了该问题
好问题 31 回答 5

128位高手大咖在线答疑解惑

说清楚

完整的描述具体问题和细节

1

耐心等

回答问题需要认真思考,请耐心等待

2

巧咨询

还有疑问?及时追问获取更多答案

3
我要提问