不知道大家最近刷到麦当劳用 AI 制作的宣传片没有,太火了啊!16 秒的视频在推特上火出圈了,浏览量接近千万,而且一直在增长。
这则广告内容是关于日本麦当劳即将举行的薯条优惠活动,视频由 11 名 AI 生成的美女组成,她们以不同的风格和方式展示麦当劳薯条,最后以一名少女真正吃到薯条作为结尾。作者是知名 AI 艺术家 Kaku Drop 架空飴。
感觉这种 AI 宣传视频,以后也是一个趋势了,而且从成本方面考虑,用AI来做广告,也比找真人代言划算多了。AI “代言人” 既便宜又不会塌房,还可以根据产品量身定做相匹配的代言人形象。
昨天,OpenAI 发布了名为 SearchGPT 的 AI 搜索产品,并开放候补名单,进行小范围测试。这个从 5 月就开始传言的产品正式亮相。
不过 SearchGPT 还没全面开放,需要先申请加入 waitlist。
内测申请地址🔗 https://chatgpt.com/search
- 功能特点: - SearchGPT能够快速生成带图片和来源的新闻,并附带详细属性和超链接。 - 与传统搜索引擎相比,SearchGPT能够实时提供最新资讯。 - 支持多轮深度对话,根据搜索内容继续提问和共享搜索结果。
OpenAI 表示,SearchGPT 旨在将模型的强大能力来检索网络的信息,为用户提供快速及时的答案,并附有清晰和相关的来源。目前先向一小部分用户开放,以获取反馈意见。
近期,Stability AI 推出的一款创新性视频生成模型 Stable Video 4D
模型下载:https://huggingface.co/stabilityai/sv4d
Stable Video 4D 的主要特点: - 高质量视频内容:Stable Video 4D 能够处理和生成高质量的视频内容,满足专业应用的需求。 - 合成数据集训练:虽然目前主要基于合成数据集进行训练,但 Stability AI 正在优化模型以适应真实世界的视频场景。 - 相关模型:除了 Stable Video 4D,Stability AI 还发布了 Stable Video Diffusion 和 SV3D 等模型,它们支持从图像或文本生成视频,并在多视图合成和高分辨率视频生成方面表现出色。
个人感觉这个模型还挺强的,大家觉得有哪些实际应用场景啊?
OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”,是一款扩大聊天机器人应用范围的小型AI模型,它被标榜为功能强大且成本效益高的模型,并预留了未来整合图像、视频和音频处理能力的空间。
作为多模态技术推进的一部分,GPT-4o mini 即时起服务于ChatGPT的免费、Plus及Team用户,预计下周覆盖Enterprise用户。它是基于GPT-4o(5月发布,具备全面的多媒体处理能力和高速度)的精简版,优化了成本和响应速度,能处理长达128K tokens的上下文,特别提升了对非英文内容的支持,知识库更新至2023年10月。
在MMLU和MGSM基准测试中,GPT-4o mini表现出色,分别获得了82%和87.0%的分数,优于同类模型。目前,该模型已具备文本和图像处理功能,未来将扩展至视频和音频领域,大家觉得怎么样?
戳链接查看详情:GPT-4o mini
哈哈哈,这不是好起来来了吗!!
百度公司最近推出了一款名为"文小言"的AI数字人社交APP。是基于文心大模型技术,可以通过手写、语音和图片等多种方式与数字人交流,享受其以语音、文字和肢体语言相结合的生动回复。最核心的是能够与AI角色建立情感连接,享受不间断的聊天体验。
文小言的主要功能 1、有问必答:AI伙伴随时在线,可以聊关于生活、感情、游戏、工作、历史、新闻等话题。 2、海量角色:文小言提供多种角色选择,包括傲娇女友、温柔空姐、健身教练、舞蹈老师等,满足不同用户的喜好。 3、沉浸互动:文小言支持全屏沉浸式聊天,包括语音、文字、图片和视频通讯。 4、实用专家:文小言提供专业行家的答疑解惑,涵盖画画创作、生活妙招、旅行攻略、新闻时事、同城资讯等领域。 5、免费聊天:用户可以不受时间限制地享受免费聊天服务。
近日有内幕爆出,苹果公司不会在今年推出由 Apple Intelligence 驱动的全新 Siri。
苹果会计划在明年 1 月开启全新 Siri 测试,并在 iOS 18.4 中推出正式版本。另外,Siri 的其他功能,例如新设计和 ChatGPT 集成,将于今年晚些时候推出。此前的报道中,Gurman 指出 Apple Intelligence 也将出现在 Vision Pro 上,但要到明年。
苹果在 6 月举办的 WWDC 上推出了搭载 Apple Intelligence (Apple 智能)的全新 Siri,用户在升级到 iOS 18 后,可以更自然地与 Siri 对话,新的 Siri 还能够很好地理解上下文。
不过,全新 Siri 只支持 iPhone 15 Pro 及以上的设备,而即将推出的 iPhone 16 系列也将支持 Apple Intelligence。另外,Mac 和 iPad 设备需要搭载 M1 及以上的芯片才能使用 Apple Intelligence。
大家对新版的 Siri 有哪些期待呢?
近日,苹果公司与瑞士洛桑联邦理工学院(EPFL)联合开源了一款名为4M-21的多模态视觉模型。该模型具有广泛的通用性和灵活性,尽管只有30亿参数,但它可以执行数十种任务,包括图像分类、目标检测、语义分割、实例分割、深度估计和表面法线估计等。
4M-21模型在21种不同的模态下进行训练,能够处理包括图像、文本、音频等多种模态的任务。这种多模态能力使其在跨模态检索、可控生成和开箱即用性能方面表现出色。
4M-21还支持任意到任意模态的转换,进一步扩展了其应用范围。
4M-21模型的推出标志着从传统单模态优化模型向多模态综合处理能力的重大转变,展示了苹果在AI领域的强大实力和创新能力。
开源地址:https://github.com/apple/ml-4m/ 论文地址:https://arxiv.org/abs/2406.09406 在线demo:https://huggingface.co/spaces/EPFL-VILAB/4M
最近,Stability AI做出了一个重大决策,修改了其社区许可协议,允许Stable Diffusion 3 Medium(简称SD3-M)模型商业化使用。如果企业或个人开发者年收入不超过100万美元(约726万人民币),只需向Stability AI提交申请,即可免费将SD3-M用于商业目的,如数据微调和生成式AI应用开发。
根据最新的协议,100万美元的收入门槛是硬性条件,不论收入是否直接来自SD3-M的使用。Stability AI还承诺,将在未来几周内发布一个更大版本的模型,并继续与社区分享,意味着该模型将会持续开源。
SD3-M模型拥有20亿参数,生成图片时间平均为2至10秒,推理效率高,对硬件要求低,适合在多种设备上运行。相较于前几代,它在图片质量、文本语义、光影和色彩表现上有显著提升,特别是在文本嵌入方面改进明显,提高了字体识别和嵌入的准确性。
训练过程中,SD3-M使用了包含10亿张图片的公开和合成数据集进行预训练,另外还使用了3000万张特定艺术风格和领域的图片进行微调,以及300万张偏好图片。
开源地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium 填写申请地址:https://stability.ai/community-license
今天发现了一个声音克隆的好东西,我刚刚挖到的Fish Speech这个工具,不仅生成速度快到飞起,而且克隆出的声音也很真实,支持文字转语音功能,非常的好用!
Fish Speech 是一款由fishaudio开发的全新文本转语音(TTS)工具,具有强大的语音克隆能力。用户只需提供一段参考语音,系统便能迅速进行语音克隆,无需繁琐的训练过程。
该工具支持中文、英语和日语等多种语言,并且在语音处理上的能力接近人类水平。 Fish Speech采用了先进的AI技术,包括VQ-GAN、Llama和VITS等,能够将文本转换成逼真的语音。它还采用了Flash-Attn算法,以提高处理大规模数据的效率和稳定性。这些技术使得Fish Speech不仅在语音合成方面表现出色,还在语音克隆方面具有显著的优势。
Fish Speech的语音克隆功能特别适合内容创作者使用,他们可以利用这一工具快速生成各种声音效果,用于视频配音、播客制作等场景。
试玩地址:https://fish.audio/zh-CN/
上半年 Sora 爆火到现在,AI 在视频领域的发展越来越强了,近日,Runway 的 Gen-3 Alpha 文字转视频功能向所有人开放了。
Runway Gen-3 Alpha 的文字转视频功能是其核心功能之一。用户只需输入文字描述或关键词,Gen-3 Alpha 就能够通过其强大的深度学习算法,自动生成与之相关的视频作品。这一功能不仅支持简单的文本到视频转换,还提供了多种高级创作工具,如运动画笔、相机控制和导演模式等,进一步提升了视频制作的专业度和灵活性。
Runway Gen-3 Alpha 在保真度、一致性和运动表现上均实现了显著的突破,能够生成高保真的视频片段,最长可达10秒。用户可以选择生成5秒或10秒的视频,并且可以根据需要调整视频的详细程度和风格。
Runway Gen-3 Alpha 的文字转视频功能不仅强大且灵活,能够满足各种创意需求,还在技术上取得了显著的进步,成为AI视频生成领域的一大亮点。
但是目前想体验还是需要开通12美元的会员~