OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”,是一款扩大聊天机器人应用范围的小型AI模型,它被标榜为功能强大且成本效益高的模型,并预留了未来整合图像、视频和音频处理能力的空间。
作为多模态技术推进的一部分,GPT-4o mini 即时起服务于ChatGPT的免费、Plus及Team用户,预计下周覆盖Enterprise用户。它是基于GPT-4o(5月发布,具备全面的多媒体处理能力和高速度)的精简版,优化了成本和响应速度,能处理长达128K tokens的上下文,特别提升了对非英文内容的支持,知识库更新至2023年10月。
在MMLU和MGSM基准测试中,GPT-4o mini表现出色,分别获得了82%和87.0%的分数,优于同类模型。目前,该模型已具备文本和图像处理功能,未来将扩展至视频和音频领域,大家觉得怎么样?
戳链接查看详情:GPT-4o mini
SVGStud.io 是一个基于AI的工具,用于搜索和生成可缩放矢量图形(SVG)。
核心功能包括:
1、免费的SVG束:浏览大量预生成的SVG。 2、语义化SVG搜索:找到尽可能接近搜索词或样本图像的SVG文件。 3、基于AI的SVG生成器:根据文本描述和(可选)示例图像生成新的SVG。迭代优化SVGs。
所有在SVGStud.io 上的 SVG 都遵循CC-BY-SA 4.0许可证。使用 SVGStud.io 需要接受并遵守使用限制。
还可以将 SVG 转换为其他格式,如 DXF 和 EPS。所有生成的文件都可以随时下载。
传送门:SVGStud.io
Magnific 又一次找到新的增长点了。这次,他们推出了一个PS插件,
这个插件的主要功能包括图像放大和细节增强,能够直接在 Photoshop 内部使用,无需额外操作。
具体来说,Magnific 的 PS 插件通过 Adobe Store 安装后,可以无缝集成到 Photoshop 中。用户只需点击放大按钮,插件便会在 Photoshop 中自动工作,将放大后的图像作为新图层插入,从而保持创作过程的流畅性。
MagnificPS插件的详细使用教程:
Magnific 的这一插件不仅简化了图像处理流程,还显著提升了工作效率,满足了专业用户的高需求。大家觉得这个插件的实用性怎么样?
近日,苹果公司与瑞士洛桑联邦理工学院(EPFL)联合开源了一款名为4M-21的多模态视觉模型。该模型具有广泛的通用性和灵活性,尽管只有30亿参数,但它可以执行数十种任务,包括图像分类、目标检测、语义分割、实例分割、深度估计和表面法线估计等。
4M-21模型在21种不同的模态下进行训练,能够处理包括图像、文本、音频等多种模态的任务。这种多模态能力使其在跨模态检索、可控生成和开箱即用性能方面表现出色。
4M-21还支持任意到任意模态的转换,进一步扩展了其应用范围。
4M-21模型的推出标志着从传统单模态优化模型向多模态综合处理能力的重大转变,展示了苹果在AI领域的强大实力和创新能力。
开源地址:https://github.com/apple/ml-4m/ 论文地址:https://arxiv.org/abs/2406.09406 在线demo:https://huggingface.co/spaces/EPFL-VILAB/4M
今天发现了一个声音克隆的好东西,我刚刚挖到的Fish Speech这个工具,不仅生成速度快到飞起,而且克隆出的声音也很真实,支持文字转语音功能,非常的好用!
Fish Speech 是一款由fishaudio开发的全新文本转语音(TTS)工具,具有强大的语音克隆能力。用户只需提供一段参考语音,系统便能迅速进行语音克隆,无需繁琐的训练过程。
该工具支持中文、英语和日语等多种语言,并且在语音处理上的能力接近人类水平。 Fish Speech采用了先进的AI技术,包括VQ-GAN、Llama和VITS等,能够将文本转换成逼真的语音。它还采用了Flash-Attn算法,以提高处理大规模数据的效率和稳定性。这些技术使得Fish Speech不仅在语音合成方面表现出色,还在语音克隆方面具有显著的优势。
Fish Speech的语音克隆功能特别适合内容创作者使用,他们可以利用这一工具快速生成各种声音效果,用于视频配音、播客制作等场景。
试玩地址:https://fish.audio/zh-CN/
今年4月份给大家透露过我们要发布新字体,现在优设招牌体正式发布!
优设招牌体是一款传统书写结合现代工具创作的标题美术字体。取魏碑结构转折锐利锋芒的特点,笔画造型匀称有力,给人一种刚毅且浑厚的气质。字体骨架左低右高,赋予其勃勃生机,主笔粗细相间中宫收紧,整体风格质朴刚强、气势恢宏。
我们期望优设招牌体以它独特的磅礴之美打动你,成为大家在各类设计中的理想选择,让人不容忽视,甚至眼前一亮。如商业门面的醒目招牌、文化传播的力作海报、及富含传统韵味的产品包装等,帮助你的产品处处彰显非凡格调。
更多介绍看这里👉 https://www.uisdc.com/uisdc-zhaopaiti
卷起来了,前不久阿里云推出了首个“AI程序员”。能够一站式自主完成任务分解、代码编写、测试、问题修复和代码提交等整个过程,能够在分钟级时间内完成应用开发。 近日,字节跳动推出了一款名为豆包 MarsCode 的智能开发工具,面向国内开发者免费开放。
核心功能: 1、提供智能代码补全、Bug修复、单元测试生成等AI功能。 2、支持多种编程语言和主流IDE。
云端集成开发环境(Cloud IDE):豆包MarsCode包含AI原生的云端IDE,无需配置复杂环境,直接在浏览器中进行编程和调试。 支持语言:支持C、C++、C#、Go、JavaScript、Java、Node.js、Rust、TypeScript等多种编程语言。 开发模板:提供多种开发环境和模板,减少环境配置时间。 原生AI能力:具备代码自动补全与生成、问题修复、代码优化等功能。
主要特点: 1、开箱即用,简化环境配置。 2、云端IDE,随时随地开发。 3、弹性云端资源,不受本地资源限制。
主要功能: - 编程助手和Cloud IDE:提供代码编写提议、代码补全、Lint错误修复等。 - 项目问答功能:针对需求开发、Bug修复、开源项目学习等场景提供支持。
更多介绍可以访问豆包 MarsCode官网!
昨天,在开发者们收到的警告信中,OpenAI 写道:将采取额外措施,封禁来自不支持国家和地区的API流量。7月9日起,将终止对不支持国家的API服务,中国包括在内。
昨天看到有小伙伴还在吐槽,刚续费了 ChatGPT 会员,不要慌,现在 LibreChat 横空出世,作为一个免费的开源 ChatGPT 克隆版,它不仅支持多种 AI 模型,还提供了灵活的自定义选项,解决了多 AI 模型整合和切换的问题。
LibreChat 代表了开源的精神和对技术的热爱,为用户提供了安全、灵活的聊天环境,大家不妨用着试试看!
LibreChat 官网
大家好,我想给大家介绍一个专为插画师和艺术爱好者设计的在线AI上色工具:Petalica Paint ,推荐大家试玩~
Petalica Paint 它的一大特点是内置的AI自动上色功能,你只需上传线稿图,软件就能智能识别并自动填充色彩,大大缩短了手动上色的时间,非常适合追求效率的创作者。工具提供了多样化的上色风格选项,可以根据作品的风格和自己的喜好进行选择。
Petalica Paint 还有线稿提取功能,无论是草图还是照片,都能清晰地分离出线条,为上色前的准备工作做好铺垫。在色彩调整方面,用户享有高度自由,可以任意调节颜色、透明度和饱和度,确保每个细节都符合你的创作愿景。
该软件与pixiv Sketch平台实现了良好的集成,你可以在pixiv Sketch里直接无缝使用Petalica Paint的各项功能,无需切换应用。
试玩→ Petalica Paint
近日,Anthropic 公司发布了 Claude 3.5 Sonnet,作为 OpenAI 的劲敌,这款全新的人工智能模型在智能水平上超越了所有的竞争对手。在推理、知识和编码能力方面,Claude 3.5 Sonnet 能够迅速理解复杂指令,撰写出高质量内容。与 Claude 3 Opus 相比,解码速度提升两倍,编码评估中解决的问题比例高达64%,展现出无与伦比的独立编写、编辑和执行代码能力,
Artifacts 功能更是锦上添花,允许用户在Claude.ai上动态编辑和构建Claude生成的内容,甚至能直接展示生成的代码为网页,无论是HTML、JS、CSS还是SVG都能轻松实现。
Claude 3.5 Sonnet的到来,意味着代码世界即将迎来一场革命。你,准备好迎接挑战了吗?
最近,Anthropic 发布了全新大模型 Claude 3.5 Sonnet,号称是迄今为止最智能的模型。
Claude 3.5 Sonnet 是 Anthropic 即将推出的 Claude 3.5 系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude 3 Opus。而且,运行速度、成本与自家前代 Claude 3 Sonnet 相当。最重要的是可以免费使用!
以下是关于Claude 3.5 Sonnet的几个关键点: 1. 模型性能:Claude 3.5 Sonnet在多个基准测试中,包括研究生水平推理(GPQA)、本科生水平知识(MMLU)和编码能力(HumanEval),设定了新的行业标准,展现出对细微差别、幽默和复杂指令的出色理解能力,以及以自然、友好的方式生成高质量内容的能力。 2. 速度与成本:它的运行速度是其前代Claude 3 Opus的两倍,同时保持了与Claude 3 Sonnet相似的成本效益,这意味着对于用户来说,它能更高效地处理复杂任务,且价格合理。 3. 免费与付费访问:Claude 3.5 Sonnet在Claude.ai网站和iOS应用上免费提供给用户,而订阅了Claude Pro和Team计划的用户可以享受更快的访问速率。此外,它也通过Anthropic API和亚马逊云科技Bedrock等平台提供,定价为每百万个输入token 3美元,每百万个输出token 15美元。 4. 视觉能力:该模型在视觉识别和处理方面也表现出色,成为Anthropic至今为止最强的视觉模型,特别是在处理视觉推理任务,如解释图表、图形转录文本等方面,这对零售、物流和金融服务等行业尤为重要。 5. Artifacts功能:Anthropic引入了一项名为Artifacts的新功能,允许用户在与Claude交互时,于对话旁边专用窗口中实时查看、编辑和构建由Claude生成的内容,比如代码片段、文本文档和网站设计,进一步促进了人工智能与人类工作的无缝集成。 6. 安全性考量:Claude 3.5 Sonnet经过严格的安全测试,并被分类为AI安全等级2(ASL-2),意味着它在化学、生物、放射性、核风险、网络安全和自主能力等领域使用相对安全,不会造成灾难性损害。Anthropic还与外部专家合作,不断测试和完善模型的安全机制,以减少滥用风险。
地址:https://claude.ai/
Adobe Acrobat 迎来了重大 AI 升级,支持多文档分析和图像生成,此次升级主要包括以下两个方面:
1、多文档分析:Acrobat 的 AI 助手现在能够同时分析和查询多个文档,包括非 PDF 文件。这意味着用户可以将多个 PDF 或其他格式的文件拖拽至应用程序中,AI 助手会自动处理这些文件并提供相关信息。
2、图像生成和编辑:Adobe Acrobat 引入了全新的“Generate Image”功能,用户可以选择 PDF 文件中的某段内容,调用 AI 来生成图片,并调整图片的样式和大小。还有“Edit Image”功能,允许用户通过 Firefly AI 模型对现有图像进行编辑,例如删除背景、擦除和裁剪等。
这次升级显著增强了 Acrobat 的功能,使其在处理复杂文档和图像方面更加高效和智能。