问答分类 AI创作 - 优设网

Runway 宣布 Gen-3 Alpha 上线图生视频功能，在电影制作和视频创作中有哪些潜在的应用场景？

近日，Runway 公司在 X 上宣布其 6 月中旬推出的 AI视频模型Gen-3Alpha正式推出图生视频功能。此更新允许用户将任何图像用作视频生成的第一帧，可以单独使用，也可以与文本提示一起使用。

而且现在的 Gen-3 Alpha 从上传图片到视频生成，速度快得就像闪电，而且视频的质量也是杠杠的。Runway的Gen-3Alpha在图像转视频的技术上，可以说是一骑绝尘，不仅速度快，质量也是没得说。

大家觉得这项技术在电影制作和视频创作中有哪些潜在的应用场景？

点赞 15 回答 2

除了分享功能，ComfyUI 新版还有哪些值得关注的新特性或改进？

最近在尝试ComfyUI的新版。我在试用过程中发现还有一些其他亮点，比如交互体验和一些小细节的优化，感觉挺不错的。你们在使用新版的时候有没有发现除了分享功能外，还有哪些值得关注的新特性或改进呢？

2.9k 设计师围观了该问题

点赞 19 回答 1

Candy 邀你回答

2024/07/29

求一个将 Midjourney 图片转成高清大图矢量图的方法？

RT，生成的素材尺寸比较小，求一个可以直接转成高清矢量图的方法

6.3k 设计师围观了该问题

点赞 17 回答 2

重磅出击！OpenAI 发布 SearchGPT，目标直指谷歌，AI 搜索又将迎来劲敌？

昨天，OpenAI 发布了名为 SearchGPT 的 AI 搜索产品，并开放候补名单，进行小范围测试。这个从 5 月就开始传言的产品正式亮相。

不过 SearchGPT 还没全面开放，需要先申请加入 waitlist。

内测申请地址🔗 https://chatgpt.com/search

- 功能特点： - SearchGPT能够快速生成带图片和来源的新闻，并附带详细属性和超链接。 - 与传统搜索引擎相比，SearchGPT能够实时提供最新资讯。 - 支持多轮深度对话，根据搜索内容继续提问和共享搜索结果。

OpenAI 表示，SearchGPT 旨在将模型的强大能力来检索网络的信息，为用户提供快速及时的答案，并附有清晰和相关的来源。目前先向一小部分用户开放，以获取反馈意见。

点赞 22 回答 1

Stability 发布 Stable Video 4D 模型，有哪些具体的应用场景？

近期，Stability AI 推出的一款创新性视频生成模型 Stable Video 4D

模型下载：https://huggingface.co/stabilityai/sv4d

Stable Video 4D 的主要特点： - 高质量视频内容：Stable Video 4D 能够处理和生成高质量的视频内容，满足专业应用的需求。 - 合成数据集训练：虽然目前主要基于合成数据集进行训练，但 Stability AI 正在优化模型以适应真实世界的视频场景。 - 相关模型：除了 Stable Video 4D，Stability AI 还发布了 Stable Video Diffusion 和 SV3D 等模型，它们支持从图像或文本生成视频，并在多视图合成和高分辨率视频生成方面表现出色。

个人感觉这个模型还挺强的，大家觉得有哪些实际应用场景啊？

点赞 28 回答 1

伟杰椰岛设计邀你回答

2024/07/19

很难相信，电影《Watch The Skies》翻译配音完全由 AI 完成，你辨别得出来吗？

全球第一部由 AI 完全翻译配音的电影《Watch The Skies》即将登陆美国各大院线，《Watch The Skies》是一部瑞典语的科幻电影，Flawless公司使用他们的 TrueSync 技术对电影进行了 AI 翻译和配音。

不仅仅是台词翻译，Flawless利用AI技术让电影里的所有角色全部改说英语，同时保持他们的唇形同步。就跟最开始就是使用英语拍摄的一样...太厉害了！完全分辨不出啊！

点赞 26 回答 1

大白(●—●) 邀你回答

2024/07/19

OpenAI 发布迷你 AI 模型 GPT-4o mini，都有哪些亮眼功能？

OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”，是一款扩大聊天机器人应用范围的小型AI模型，它被标榜为功能强大且成本效益高的模型，并预留了未来整合图像、视频和音频处理能力的空间。

作为多模态技术推进的一部分，GPT-4o mini 即时起服务于ChatGPT的免费、Plus及Team用户，预计下周覆盖Enterprise用户。它是基于GPT-4o（5月发布，具备全面的多媒体处理能力和高速度）的精简版，优化了成本和响应速度，能处理长达128K tokens的上下文，特别提升了对非英文内容的支持，知识库更新至2023年10月。

在MMLU和MGSM基准测试中，GPT-4o mini表现出色，分别获得了82%和87.0%的分数，优于同类模型。目前，该模型已具备文本和图像处理功能，未来将扩展至视频和音频领域，大家觉得怎么样？

戳链接查看详情：GPT-4o mini

点赞 34 回答 1

首席爆料师邀你回答

2024/07/17

什么是生成式 AI？来看看微软的解释全面吗？

对比通义千问的回答，我感觉微软的解释更好，大家觉得呢？

2.1k 设计师围观了该问题

点赞 31 回答 1

大白(●—●) 邀你回答

2024/07/16

找个 AI 女朋友也不错啊~百度推出仿真人 AI 社交 App“文小言”

哈哈哈，这不是好起来来了吗！！

百度公司最近推出了一款名为"文小言"的AI数字人社交APP。是基于文心大模型技术，可以通过手写、语音和图片等多种方式与数字人交流，享受其以语音、文字和肢体语言相结合的生动回复。最核心的是能够与AI角色建立情感连接，享受不间断的聊天体验。

文小言的主要功能 1、有问必答：AI伙伴随时在线，可以聊关于生活、感情、游戏、工作、历史、新闻等话题。 2、海量角色：文小言提供多种角色选择，包括傲娇女友、温柔空姐、健身教练、舞蹈老师等，满足不同用户的喜好。 3、沉浸互动：文小言支持全屏沉浸式聊天，包括语音、文字、图片和视频通讯。 4、实用专家：文小言提供专业行家的答疑解惑，涵盖画画创作、生活妙招、旅行攻略、新闻时事、同城资讯等领域。 5、免费聊天：用户可以不受时间限制地享受免费聊天服务。

点赞 20 回答 2

张小闲邀你回答

2024/07/08

Krea AI 新功能，图片直接和背景融合，大家觉得做什么最合适？

最近 Krea AI 发布了一个非常酷的融合功能，可以直接把图片和背景进行融合，我觉得还是挺适合做产品效果图和宣传海报的～大家觉得呢？

3.1k 设计师围观了该问题

点赞 39 回答 2

首席爆料师邀你回答

2024/07/08

苹果将在明年 1 月对 Siri 进行大升级，对此你有哪些期待？

近日有内幕爆出，苹果公司不会在今年推出由 Apple Intelligence 驱动的全新 Siri。

苹果会计划在明年 1 月开启全新 Siri 测试，并在 iOS 18.4 中推出正式版本。另外，Siri 的其他功能，例如新设计和 ChatGPT 集成，将于今年晚些时候推出。此前的报道中，Gurman 指出 Apple Intelligence 也将出现在 Vision Pro 上，但要到明年。

苹果在 6 月举办的 WWDC 上推出了搭载 Apple Intelligence （Apple 智能）的全新 Siri，用户在升级到 iOS 18 后，可以更自然地与 Siri 对话，新的 Siri 还能够很好地理解上下文。

不过，全新 Siri 只支持 iPhone 15 Pro 及以上的设备，而即将推出的 iPhone 16 系列也将支持 Apple Intelligence。另外，Mac 和 iPad 设备需要搭载 M1 及以上的芯片才能使用 Apple Intelligence。

大家对新版的 Siri 有哪些期待呢？

点赞 11 回答 2

VER!TAS 邀你回答

2024/07/07

震撼发布！4M-21：苹果多模态AI巨擘，一键解锁21种模态！

近日，苹果公司与瑞士洛桑联邦理工学院（EPFL）联合开源了一款名为4M-21的多模态视觉模型。该模型具有广泛的通用性和灵活性，尽管只有30亿参数，但它可以执行数十种任务，包括图像分类、目标检测、语义分割、实例分割、深度估计和表面法线估计等。

4M-21模型在21种不同的模态下进行训练，能够处理包括图像、文本、音频等多种模态的任务。这种多模态能力使其在跨模态检索、可控生成和开箱即用性能方面表现出色。

4M-21还支持任意到任意模态的转换，进一步扩展了其应用范围。

4M-21模型的推出标志着从传统单模态优化模型向多模态综合处理能力的重大转变，展示了苹果在AI领域的强大实力和创新能力。

开源地址：https://github.com/apple/ml-4m/ 论文地址：https://arxiv.org/abs/2406.09406 在线demo：https://huggingface.co/spaces/EPFL-VILAB/4M

点赞 23 回答 1

大白(●—●) 邀你回答

2024/07/06

重磅！Stable Diffusion 3 允许商业化，最强文生图模型任你免费商用！

最近，Stability AI做出了一个重大决策，修改了其社区许可协议，允许Stable Diffusion 3 Medium（简称SD3-M）模型商业化使用。如果企业或个人开发者年收入不超过100万美元（约726万人民币），只需向Stability AI提交申请，即可免费将SD3-M用于商业目的，如数据微调和生成式AI应用开发。

根据最新的协议，100万美元的收入门槛是硬性条件，不论收入是否直接来自SD3-M的使用。Stability AI还承诺，将在未来几周内发布一个更大版本的模型，并继续与社区分享，意味着该模型将会持续开源。

SD3-M模型拥有20亿参数，生成图片时间平均为2至10秒，推理效率高，对硬件要求低，适合在多种设备上运行。相较于前几代，它在图片质量、文本语义、光影和色彩表现上有显著提升，特别是在文本嵌入方面改进明显，提高了字体识别和嵌入的准确性。

训练过程中，SD3-M使用了包含10亿张图片的公开和合成数据集进行预训练，另外还使用了3000万张特定艺术风格和领域的图片进行微调，以及300万张偏好图片。

开源地址：https://huggingface.co/stabilityai/stable-diffusion-3-medium 填写申请地址：https://stability.ai/community-license

7.1k 设计师围观了该问题

点赞 37 回答 1

～简单～邀你回答

2024/07/04

足以媲美 GPT-SoVITS 的语音克隆工具：Fish Speech，推荐给大家！

今天发现了一个声音克隆的好东西，我刚刚挖到的Fish Speech这个工具，不仅生成速度快到飞起，而且克隆出的声音也很真实，支持文字转语音功能，非常的好用！

Fish Speech 是一款由fishaudio开发的全新文本转语音（TTS）工具，具有强大的语音克隆能力。用户只需提供一段参考语音，系统便能迅速进行语音克隆，无需繁琐的训练过程。

该工具支持中文、英语和日语等多种语言，并且在语音处理上的能力接近人类水平。 Fish Speech采用了先进的AI技术，包括VQ-GAN、Llama和VITS等，能够将文本转换成逼真的语音。它还采用了Flash-Attn算法，以提高处理大规模数据的效率和稳定性。这些技术使得Fish Speech不仅在语音合成方面表现出色，还在语音克隆方面具有显著的优势。

Fish Speech的语音克隆功能特别适合内容创作者使用，他们可以利用这一工具快速生成各种声音效果，用于视频配音、播客制作等场景。

试玩地址：https://fish.audio/zh-CN/

7.9k 设计师围观了该问题

点赞 18 回答 3

大白(●—●) 邀你回答

2024/07/03

Runway Gen-3 Alpha 文字转视频功能开放，人人可以做大片了！

上半年 Sora 爆火到现在，AI 在视频领域的发展越来越强了，近日，Runway 的 Gen-3 Alpha 文字转视频功能向所有人开放了。

Runway Gen-3 Alpha 的文字转视频功能是其核心功能之一。用户只需输入文字描述或关键词，Gen-3 Alpha 就能够通过其强大的深度学习算法，自动生成与之相关的视频作品。这一功能不仅支持简单的文本到视频转换，还提供了多种高级创作工具，如运动画笔、相机控制和导演模式等，进一步提升了视频制作的专业度和灵活性。

Runway Gen-3 Alpha 在保真度、一致性和运动表现上均实现了显著的突破，能够生成高保真的视频片段，最长可达10秒。用户可以选择生成5秒或10秒的视频，并且可以根据需要调整视频的详细程度和风格。

Runway Gen-3 Alpha 的文字转视频功能不仅强大且灵活，能够满足各种创意需求，还在技术上取得了显著的进步，成为AI视频生成领域的一大亮点。

但是目前想体验还是需要开通12美元的会员~

2.1k 设计师围观了该问题

点赞 36 回答 2

大白(●—●) 邀你回答

2024/07/02

GPT-4o 智能眼镜要来了，Solos AirGo Vision 发布，你会购买吗？

Solos 是一家专门生产智能眼镜的公司，近日它们推出了 Solos AirGo Vision 智能眼镜，这是全球首款集成 GPT-4o 技术的可穿戴设备，让你随时随地都能体验到人工智能的魅力！

更多功能和特点包括： - 提供实时多语言翻译 - 与 ChatGPT 通过自然对话交互 - 可自行选择镜框。包括日常眼镜、太阳镜和运动太阳镜等样式 - 通过触摸传感器向上或向下更改音量 - 通过虚拟按键一键连接 Solos 智能眼镜 - 通过USB-C 连接口充电 - 具有 IP67 级防水功能，可户外活动佩戴 - 可持续 10 小时播放音乐或 7 小时通话

官网地址：https://solosglasses.com/

点赞 9 回答 3

菜单 优设网uisdc.com 优设网 - 学设计上优设

您还未登录

登录后即可体验更多功能

优设问答你的职场经验书

Midjourney

热门！已发布1085篇

AI绘画

热门！已发布1960篇

Runway

已发布23篇文章

ComfyUI

已发布63篇文章

刘谦Designer 邀你回答

新世纪福娃Troy 邀你回答

Candy 邀你回答

设计师龙晖 邀你回答

大白(●—●) 邀你回答

伟杰椰岛设计 邀你回答

大白(●—●) 邀你回答

首席爆料师 邀你回答

大白(●—●) 邀你回答

张小闲 邀你回答

首席爆料师 邀你回答

VER!TAS 邀你回答

大白(●—●) 邀你回答

～简单～ 邀你回答

大白(●—●) 邀你回答

大白(●—●) 邀你回答

近期热门问题

吴彦祖为咖啡店设计新LOGO！灵感你看出来自哪里了吗？

11位设计师参与回答

你觉得工作中什么能力能吃一辈子？

11位设计师参与回答

设计师倒贴上班的10大表现，你中了几个？

9位设计师参与回答

网友提问：入职一个月后有了更好的offer，该怎么提离职？

8位设计师参与回答

上厕所超时被乐捐罚款？你公司有“乐捐”的规定吗？

7位设计师参与回答

网友票选的17个选公司闭坑指南，你赞同吗？

6位设计师参与回答

近期热门回答

新世纪福娃Troy

霖渊鼠

喝不喝拿铁

优设读报 2025年04月05日 星期六

字节即梦 3.0 开启灰度测试：细节表现力飙升

美图云修 7.0 版本上线：修图效率提升 79％

Genspark 发布自动化 AI 代理 Super Agent：具备自主思考、调用工具的能力

Claude 团队发布 Prompt Engineering 指南，助力无代码开发

Hugging Face 新增实用功能：一键查看电脑可运行模型

128位高手大咖在线答疑解惑

说清楚

完整的描述具体问题和细节

耐心等

回答问题需要认真思考，请耐心等待

巧咨询

还有疑问？及时追问获取更多答案

优设官方微信群

添加管理员 招财

微信号: 扫码添加

严格审核打造高质量交流群

优设小黄鸡官方周边

扫码小店购买

关于我们

热门频道

设计灵感

支持与服务

官方社群

优设官方微信群

微信扫码 添加管理员 招财

微信号： 扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告

优设微博

优设AIGC

400W粉丝！每日更新设计干货

优设

强烈推荐！优设官方品牌微博

优优教程网

菜单优设网 - 学设计上优设

设计师龙晖邀你回答

伟杰椰岛设计邀你回答

首席爆料师邀你回答

张小闲邀你回答

首席爆料师邀你回答

～简单～邀你回答

优设读报 2025年04月05日星期六

添加管理员招财

微信扫码添加管理员招财

微信号：扫码添加