问答分类网站神器 - 优设网

性能超越ChatGPT，阿里通义千问重磅升级，免费开放1000万字长文档处理！

阿里通义千问迎来了一次重磅升级，其1000万字的长文档处理功能现已向所有人免费开放，这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起，无论是金融、法律、科研、医疗还是教育领域的专业人士，都可以通过通义千问的网站和APP，轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文，以及分析考试成绩和总结深度文章。

在金融领域，专业人士只需上传公司财报，通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息，帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后，通义千问还能生成公司在这一阶段内的业务变化、业绩趋势，并进行深入的财报分析。

在法律领域，通义千问同样展现出强大的能力。对于律师和法官而言，阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而，通义千问能够迅速阅读并分析这些法律文件，帮助用户迅速掌握法律条文的要点。输入特定案件信息后，通义千问还能给出相应的判罚建议，极大地提高了工作效率。

目前，通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用，展现出了其在智能科技领域的卓越实力。

点赞 21 回答 3

微软发布 Mora 视频生成项目，被吹爆的 Sora 可能被超越吗？

微软推出了一项名为Mora的视频生成项目，该项目利用先进的Agents技术来尝试复原Sora的视频生成能力。目前，Mora已经能够基本还原Sora的所有功能，并可以生成分辨率为1024*576的12秒视频。

这些复原的能力包括：将文本直接转换为视频、根据特定的文本条件将图片转换成视频、扩展已有的视频内容、实现视频到视频的编辑、串联多个视频片段，以及模拟数字世界等。

项目简介：原文链接

Mora项目基于一种新型的多AI智能体框架，融合了多个尖端的视觉AI智能体，旨在复刻Sora所展示的强大的通用视频生成能力。Mora能够灵活运用这些视觉智能体，在各种任务中成功地模仿了Sora的视频生成技巧。

通过广泛的实验验证，我们发现Mora在这些任务上的表现已经与Sora相当接近。从整体性能上评估，Mora与Sora之间仍然存在一些差距。但是，我们仍对Mora项目寄予厚望，希望它能够引领未来视频生成技术的发展方向，并通过多AI智能体的协同工作实现更多的突破。

2.6k 设计师围观了该问题

点赞 14 回答 2

Adobe 又整活了，Substance 3D 整合 AI 功能，能基于文本生成纹理、背景了！

Adobe 公司为其 Substance 3D Sampler 和 Stager 应用整合了 Firefly 生成式人工智能功能，旨在帮助工业设计师、游戏开发人员和视觉特效专业人员更高效地完成 3D 相关工作。

Substance 3D Stager：这是一个基于Adobe Dimension重新构建的应用，允许用户在3D场景中轻松组建模型、材质和灯光环境，并生成高质量的虚拟照片。 Substance 3D Sampler：由Substance Alchemist进化而来，Sampler简化了材质创建过程，用户可以通过一张照片快速生成可调节参数的智能3D材质。

AI功能更新：本次更新引入了两项AI功能：

1、文本到纹理（Text to Texture）：创作者可以输入文本提示词，在3D物体表面生成逼真或风格化的纹理，无需使用实物原型、图片库或手动摄影。

2、生成背景（Generative Background）：基于用户输入的文本提示词，创建详细的背景图片，并能智能地将对象合成到场景中，匹配透视和光照。

4.5k 设计师围观了该问题

点赞 14 回答 4

AI 学习资料难找？想系统学习没头绪？Datawhale 帮你轻松入门！

给大家推荐一个 AI 知识系统学习的Datawhale，Datawhale是一个致力于人工智能教育的组织，旨在帮助学习者通过实践项目来掌握AI相关的知识和技能，也提供论坛便于大家交流学习心得！

以下是网站内容的概述：Datawhale官网

- AI学习起点：Datawhale鼓励每个人学习和探索人工智能，以共同塑造和掌握AI的未来。 - 学习路径：网站提供了多个学习路径，包括数据分析、计算机视觉、自然语言处理和推荐系统等，以帮助学习者系统地学习AI领域的知识。 - 大模型应用开发：Datawhale提供了面向小白开发者的大模型应用开发教程，结合个人知识库助手项目，教授大模型开发的重点入门知识。 - LLM入门课程：这是一个面向开发者的LLM（Large Language Models）入门教程，基于吴恩达老师的大模型系列课程内容，提供中文翻译和范例代码，指导开发者如何基于LLM开发应用程序。 - GPT - Prompt教程：Datawhale设计了GPT - Prompt教程，旨在帮助学习者更好地利用GPT等工具提高学习和工作效率。 - 南瓜书 PumpkinBook：这是一本开源协作学习笔记，作为周志华《机器学习》的伴侣书，旨在帮助初学者提升数学基础能力。 - Joyful-Pandas：这个教程涵盖了pandas库的所有核心操作与特性，分为基础知识、操作和数据三大模块。 - fantastic-matplotlib：关于Matplotlib的数据可视化教程，Matplotlib是Python中重要的数据可视化工具，本教程适合需要进行数据可视化的人员。

5.2k 设计师围观了该问题

点赞 35 回答 3

晓哥学摄影邀你回答

2024/03/20

将任意图片转化成你想要的风格，Magnific AI 照片风格化功能太强了！

小伙伴们，听说过Magnific AI这款神器吗？感觉比较适合平时喜欢P图的朋友，或者摄影师，当然了需要大量后期修图的设计师也可以试试。

最厉害的是，它能够将图像分辨率提升至最高1亿像素，支持最高放大16倍，达到10000×10000的分辨率。该工具不仅能够放大图像，还能根据用户的提示和参数添加或重构细节，使图像变得更加高清和细腻。

Magnific AI还提供了像素级AI重绘功能，通过魔法般的重绘图像细节和像素块，保证清晰度。

Magnific AI具有灵活的设置调整功能，支持输入提示词、提供Creativity、HDR、均衡等调整选项，以及针对人像、插画、游戏资产、自然风光、摄影、3D渲染等多种优化场景。

最近，Magnific AI的照片风格化功能上线了，可以将你的任意照片转换成你想要的任意风格，喜欢摄影的朋友，推荐一定要试一试。Magnific AI 官网

6.3k 设计师围观了该问题

点赞 17 回答 2

L-先生邀你回答

2024/03/18

求分享几个包装灵感网站？

大家有没有收藏好用的包装设计灵感网站啊？求分享！

8.8k 设计师围观了该问题

点赞 34 回答 1

大白(●—●) 邀你回答

2024/03/15

谷歌发布 VLOGGER 模型，可根据输入图片和音频生成人物讲话视频！

谷歌发布的一个名为 VLOGGER 的项目。这个项目能够根据输入的图片和音频生成对应人物讲话的视频。但是个人感觉 VLOGGER 看起来没有阿里巴巴发布的 DreamTalk 和 EMO 自然，大家觉得呢？

VLOGGER 主要特点： 1. 3D运动的扩散模型：它可以根据一张人物图像生成由文本和音频驱动的说话人视频。 2. 创新的架构：项目包含一个创新的基于扩散的架构，通过时间和空间控制来增强文本到图像模型的能力。 3. 高质量视频生成：能够生成高质量、可变长度的视频，并通过人脸和身体的高级表示进行便捷控制。 4. 广泛的适用性：与之前的工作相比，VLOGGER不需要为每个人单独训练模型，不依赖人脸检测和裁剪，能生成完整的图像（包括脸部和身体），适用于广泛场景，如躯干可见或身份多样化，这对于正确合成具有沟通能力的虚拟人至关重要。

项目地址：https://enriccorona.github.io/vlogger/

点赞 19 回答 3

首席爆料师邀你回答

2024/03/12

Microsoft Copilot 重大更新！现推出定制 Copilot GPT，快来创建自己专属的 GPT 吧！

小伙伴们，Microsoft Copilot 的重大更新！定制 Copilot GPT 现已推出。这意味着你可以在微软的工具里创建自己的 GPT 并共享它们~

具体方法如下：

→ 创建Copilot GPT ①访问官网：https://copilot.microsoft.com/ ②点击右侧的“查看所有 Copilot GPT” ③然后选择“创建新的 Copilot GPT”

→设置你的Copilot ①关注 creation chat ②设置名称、任务等 ③流程与 ChatGPT Plus 相同，无需个人资料照片

→配置你的Copilot ①可以单击“配置”选项卡 ②在这里你可以直接选择名称、描述、提示... ③你还可以添加知识文件并启用/禁用互联网访问和 Dall-E 3

→发布和使用 ①在发布之前单击“预览”按钮进行尝试 ②你只能为自己或任何有链接的人发布你的Copilot ③它将自动添加到右侧的 GPT 列表中

点赞 37 回答 2

茶客邀你回答

2024/03/11

求推荐一款中文的声音克隆软件，感谢！

大家有没有用过声音克隆AI软件啊，最好是支持中文的，谢谢！

点赞 21 回答 3

大眠邀你回答

2024/03/10

神器推荐！UX百科 uxbaike，设计师专业知识库！

给大家推荐酸梅干超人大佬制作的一个UX百科网站。

网站提供包括 UML 教程、iOS 设计规范、AI 插画、电脑硬件认识、前端学习、体验设计理论、UI 设计、图标学习等系统的知识。

网站首页：https://www.uxbaike.com/

2.4k 设计师围观了该问题

点赞 22 回答 2

大眠邀你回答

2024/03/06

字节跳动发布分辨率适配器 ResAdapter，支持高效生成更高清晰度的图像！

好消息，近日字节跳动推出了一种新型工具——分辨率适配器 ResAdapter，这个工具旨在解决在使用Stable Diffusion等文本到图像模型生成超出训练分辨率的图像时出现的肢体异常和画面崩坏问题。

ResAdapter能够与现有的IPadapter和Controlnet模型兼容，并且可以直接生成动态分辨率的图像，提高了图像处理的效率。

项目简介中提到，尽管像Stable Diffusion这样的模型能够创造出高质量的图像，但在生成非训练分辨率的图像时存在限制。ResAdapter通过利用广泛的分辨率先验，即使只有0.5M的容量，也能生成高分辨率且保持原有风格的图像。

ResAdapter在提高分辨率方面与扩散模型配合得很好，并且可以与其他模块兼容，用于创建不同分辨率的图像。

项目介绍地址：res-adapter.github

4.2k 设计师围观了该问题

点赞 11 回答 2

刘谦Designer 邀你回答

2024/03/04

谷歌推出生成交互大模型 Genie，一张草图直接生成视频游戏！

近日，谷歌DeepMind的研究人员推出了，首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments，简称“Genie”。

Genie是一个具有110亿参数的模型，它能够根据图像、真实照片甚至草图生成可控制动作的视频游戏。这个模型的特点是无需数据标记和无监督训练，它通过3万小时、6800万段游戏视频进行了大规模训练，而且训练过程中没有使用任何真实动作标签或其他特定提示。

Genie的核心架构使用了ST-Transformer（时空变换器），这是一种结合了Transformer模型的自注意力机制与时空数据的特性，有效处理视频、多传感器时间序列、交通流量等时空数据的方法。ST-Transformer通过捕捉数据在时间和空间上的复杂依赖关系，提高了对时空序列的理解和预测能力。

Genie的架构主要由三大模块组成： 1. 视频分词器：基于VQ-VAE的模块，将原始视频帧压缩成离散的记号表示，以降低维度并提高视频生成质量。 2. 潜在动作模型：无监督学习模块，从原始视频中推断出状态变化对应的潜在动作，并实现对每一帧的控制。 3. 动力学模型：基于潜在动作模型学习到的动作关系，预测下一帧的视频。

除了视频游戏，你觉得 Genie 模型还能在哪些其他领域发挥作用？

点赞 15 回答 3

张小闲邀你回答

2024/03/01

AIGC 神器推荐！Sora 提示词合集工具 soravideos.ai，你的创意灵感库！

今天给大家带来的是一款大热的sora提示词合集工具，作为现在最流行的视频生成工具，大家可以尽早学习起来~

官网地址：soravideos.ai

5.3k 设计师围观了该问题

点赞 23 回答 5

张小闲邀你回答

2024/02/27

APP 付费页面应该如何设计？Paywall Screens 付费墙页面合集神器推荐！

付费墙是指软件将免费与付费内容分割开，提示用户付费后才能查看内容的页面。

Paywall Screens 这个网站收集了 8 千多个付费墙页面供参考。

帮助产品经理和设计师设计出美观转化率又高的付费墙页面。

官网地址：https://www.paywallscreens.com/

3.5k 设计师围观了该问题

点赞 34 回答 3

首席爆料师邀你回答

2024/02/26

效率神器，素质超级过硬的 3D 角色库 Tomo Dachi，有需要可以码住！

Tomo Dachi 是一个素质超级过硬的 3D 角色库，这套角色库当中的角色都非常的细致，生成导出的素材高达 3000x3000px，导出的角色背景可以是透明的，涵盖多种不同的职业、不同性别、不同人种。感兴趣的同学可以下载试试。

官网地址：https://tomo-dachi.club/

点赞 18 回答 4

首席爆料师邀你回答

2024/02/23

重磅消息！Stable Diffusion 3来啦！提示文本理解更好，图像质量更强！

Stability AI 发布了 Stable Diffusion 3，宣称这是他们最强大的文本到图像模型，利用扩散转换器架构大大提高了多主题提示、图像质量和拼写能力的性能！

该版本与Stable Diffusion 2相比，在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强，可对标闭源模型Midjourney。

Stable Diffusion 3的参数在8亿——80亿之间，也就是说Stable Diffusion 3可能是专为移动设备开发的，AI算力消耗将更低，推理速度却更快。

Stable Diffusion 3 支持申请使用，未来会扩大测试范围。

申请地址：https://stability.ai/stablediffusion3

6.6k 设计师围观了该问题

点赞 10 回答 2

菜单 优设网uisdc.com 优设网 - 学设计上优设

您还未登录

登录后即可体验更多功能

优设问答你的职场经验书

adobe

已发布83篇文章

Adobe Firefly

已发布14篇文章

AI绘画

热门！已发布2012篇

微软设计

已发布19篇文章

首席爆料师 邀你回答

大白(●—●) 邀你回答

首席爆料师 邀你回答

首席爆料师 邀你回答

晓哥学摄影 邀你回答

L-先生 邀你回答

大白(●—●) 邀你回答

首席爆料师 邀你回答

茶客 邀你回答

大眠 邀你回答

大眠 邀你回答

刘谦Designer 邀你回答

张小闲 邀你回答

张小闲 邀你回答

首席爆料师 邀你回答

首席爆料师 邀你回答

近期热门问题

发明调休的人有没有考虑过单休的人？

8位设计师参与回答

智己汽车换新Logo，网友：白嫖了400万？

6位设计师参与回答

设计师的聊天日常高频词汇，你中了几个？

6位设计师参与回答

五一假期将至，留下想去的城市，去过的人安利一些美食/景点吧~

5位设计师参与回答

这就是未来人类被AI支配的样子吗？

5位设计师参与回答

《长安的荔枝》电影海报设计，你更喜欢哪个方案？

5位设计师参与回答

近期热门回答

彭凯

新世纪福娃Troy

喝不喝拿铁

优设读报 2025年04月29日 星期二

Adobe 重磅升级 Firefly AI 平台，打造图像、视频、音频全能创作引擎

DeepSeek R1T Chimera 正式上线 OpenRouter 平台

Step1X-Edit 登陆 Hugging Face，开源图像编辑领域的一次重大突破

百度联合中国文物交流中心打造首个文博智能体

Devin AI 推出 DeepWiki：AI 驱动的 GitHub 代码库理解新工具

128位高手大咖在线答疑解惑

说清楚

完整的描述具体问题和细节

耐心等

回答问题需要认真思考，请耐心等待

巧咨询

还有疑问？及时追问获取更多答案

优设官方微信群

添加管理员 招财

微信号: 扫码添加

严格审核打造高质量交流群

优设小黄鸡官方周边

扫码小店购买

关于我们

热门频道

设计灵感

支持与服务

官方社群

优设官方微信群

微信扫码 添加管理员 招财

微信号： 扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告

优设微博

优设AIGC

400W粉丝！每日更新设计干货

优设

强烈推荐！优设官方品牌微博

优优教程网

菜单优设网 - 学设计上优设

首席爆料师邀你回答

首席爆料师邀你回答

首席爆料师邀你回答

晓哥学摄影邀你回答

L-先生邀你回答

首席爆料师邀你回答

茶客邀你回答

大眠邀你回答

大眠邀你回答

张小闲邀你回答

张小闲邀你回答

首席爆料师邀你回答

首席爆料师邀你回答

优设读报 2025年04月29日星期二

添加管理员招财

微信扫码添加管理员招财

微信号：扫码添加