3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

2024/02/27 推荐： 设计师学Ai(有课）阅读 2.5w 评论有奖阅读本文需 10 分钟

文件名如何下载使用	文件大小	提取码	下载来源
Stable Cascade 模型		8888 点此复制	登录下载

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

在 2024 年 2 月 12 日，Stability.Ai 公司发布了新模型 Stable Cascade。

上线了一段时间的新模型，小伙伴们体验感如何呢？这篇文章和你深度聊聊~

往期介绍：

新模型 Stable Diffusion 3 与 Stable Cascade 全面解析

大家好，我是花生~ 最近 Stability AI 又接连推出了 2 个新的模型：Stable Diffusion 3 和 Stable Cascade，在图像生成效率和质量上比半年前推出的 SDXL 1.0 有了明显提升，今天就为大家介绍一下 2 款新模型的特点和用法。

阅读文章 >

一、前言

Stable Cascade 模型最大的优点是

是能生成带有文字的图片，文字出错率相比以前模型少很多；
其次是硬件要求降低，甚至与 sd1.5 相比，该架构比之前版本实现了 16 倍的成本降低；
最后一大亮点是模型更加理解提示词语义。

这篇文章带大家详细了解 Stable Cascade 模型。最后我整理打包了此模型，「Stable cascade 模型+安装方法+工作流」整套放在了文章最后，伙伴们自行下载~

二、效果对比（Cascade 模型与 SDXL 模型）

左边使用 Cascade 模型出的效果图片

右边使用 SDXL 模型出图效果：

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

提示词：text“stable”，Made from green shrub leaves,

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

提示词：text“stable”，The text is made of colorful energy.

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

提示词：A cute cat

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

提示词：a cat eating a piece of cheese

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

提示词：A high-definition full body photo of a beautiful Asian girl in a summer park，full-size photograph，full-size photograph

通过以上的图片，小伙伴更喜欢哪种模型出的效果呢~

根据官方给到的评估结论，在几乎所有比较中，Stable Cascade 在理解提示词语义方面和美观质量方面都表现最好。

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

Stable Cascade 模型和其他模型的数据对比

三、Cascade 模型是什么？

Cascade 模型与之前的 sd 模型相比，主要区别是可以在更小的潜空间中工作。

潜空间可以简单理解为 ai 计算生成图片的区域，潜在空间越小，推理速度就越快，训练成本也就越低。

之前的 sd 模型如果想要生成一张 1024*1024 的图片，在潜空间的编码为 128*128，使用的压缩因子为 8，可以简单的理解为 1024*1024 的图片除以 8（压缩因子）等于在潜空间的编码大小 128*128。

而 Stable Cascade 的压缩系数为 42，这意味着可以将 1024x1024 图像，在潜空间的编码为 24x24，这样就可以使用更小的潜空间尺寸，并且实现清晰的图像输出。甚至与 sd1.5 相比，该架构比之前版本实现了 16 倍的成本降低。

因此，这种模型非常适合快速的生成高质量图片。并且当前已知的扩展（如微调、LoRA、ControlNet、IP 适配器、LCM 等）也可以通过此方法实现。

四、Cascade 的文件结构

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

Stable Cascade 模型逻辑流程图

1. Stable Cascade 由三个模型组成

Stage A、Stage B 和 Stage C，代表级联生成图像。

「级联」是指多个系统、设备或组件按照一定的顺序依次连接起来，形成一个整体，其中前一个系统、设备或组件的输出作为后一个的输入。因此得名“Stable Cascade”。

2. Stable Cascade 如何级联运行

A 阶段和 B 阶段用于压缩图像，类似于 stable diffusion 中 VAE 的工作。然而，通过这种设置，可以实现更高的图像压缩。此外，阶段 C 负责在给定文本提示的情况下生成小的 24 x 24 潜伏。

比如输入提示词“鳄梨形状的扶手椅”，就会进入到第一步潜在的生成器，并且使用 stage C 模型生成较小的潜在图像，生成完成后，会进入到 stage B 和 stage A，对生成的潜在图像内容还原到像素空间。

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

Stable Cascade 模型输入提示词后的生成流程

五、使用 Cascade 模型的流程和工作流搭建

1. 下载模型

①模型下载分为两个部分：Cascade 模型+clip 模型;

②cascade 模型又分为 stageA,stageB,stageC,官方对 stage C 和 stage B 分别提供了两个版本，每个模型只需要下载其中一个即可;

③其中 stage C 提供 10 亿和 36 亿参数版本，官方强烈建议使用 36 亿版本，生成的图像会有更加有细节。

Stage B 的两个版本分别达到 7 亿和 15 亿个参数。15 亿擅长重建微小而精细的细节。

④最后，Stage A 包含 2000 万个参数，只有一个版本直接下载默认版本的即可。

如果你的电脑性能足够，当前建议直接下载较大文件体积的模型，能够获得更好的结果。

clip 模型在 text_encoder 文件夹，只有一个版本，下载 model.safetensors 模型即可。

这些模型我也打包好了，放在文章的最后，可以直接下载使用。

2. 安装模型

将 stage C 和 stage B 这两个模型放置到 ComfyUI 根目录\ComfyUI\models\unet 文件夹中。

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

stage C 和 stage B 这两个模型放置的文件位置

stage A 模型放置到 ComfyUI 根目\ComfyUI\models\vae 文件夹中

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

stage A 模型放置的文件位置

最后将 clip 模型放置到 ComfyUI 根目录\ComfyUI\models\clip 文件夹中，这样使用 cascade 的模型安装也完成了。

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

clip 模型放置的位置

3. 更新 Comfyui 版本

将 comfyui 更新到最新版本即可，官方将需要的模块已经同步进模型包了，

comfyui 的更新方法，打开秋葉的启动器，具体怎么将秋葉启动器安装到官方的 comfyui 包中，可以参考这条视频的方法。

一分钟教你使用秋葉启动器对 Comfyui 进行升降版本，版本管理：

当视频在手机上无法加载，可前往PC查看。

点击“版本管理”-右上角的“一键更新”按钮，即可将 comfyui 更新到最新版本。

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

秋葉启动器安装到官方的 comfyui 包，进行一键更新

4. 工作流搭建

拿到官方更新的 cascade 工作流之后，工作流应该会默认安装好这四个模型，你也可以点击模块上的模型加载位置检查模型是否加载完成。

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

四个模型安装位置

并且需要注意 load clip 模块上，模型的种类是否选择的是“stable_cascade”，并且加载的是刚刚下载的 clip 模型，你也可以给这个 clip 模型修改一下名称，例如“cascade_clip_model”这样就不会与其他的 clip 模型混淆。

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

确定模型种类的位置，千万别混淆了

完成以上设置之后，就可以填写提示词，进行图像生成了。

4. Cascade 模型效果展示

文字相关：在 6 个及以下字母的单词生成的准确率非常高，准确率能达到 80%。但是超出 7 个字母后，想要直接生成拼写无误的单词比较困难，准确率在 20%左右。

文字效果如下：

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

电影海报效果如下：

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

最后总结

新模型发布：Stable Cascade 在研究预览中发布，采用三阶段方法，提高了质量、灵活性、微调能力和效率，同时进一步降低了硬件要求。

技术细节：Stable Cascade 包括三个阶段（A、B、C），通过分层压缩图像，实现了使用高度压缩的潜在空间达到显著的输出效果。

训练和微调：提供了针对不同阶段的训练和微调脚本，特别是 Stage C，可以单独进行训练或微调，显著降低成本。

参数规模与效率：Stage C 提供 10 亿与 36 亿参数两种模型，Stage B 提供 7 亿与 15 亿参数两种模型，强调了效率和质量的平衡。

结语

以上，既然看到这里了，如果这篇文章能够帮助到你，或者觉得不错，随手点个赞、在看、转发三连吧~如果想要第一时间收到推送，也可以给我个星标~谢谢你看我的文章。

欢迎关注作者微信公众号：「AI芝士计划」

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

文件名如何下载使用	文件大小	提取码	下载来源
Stable Cascade 模型		8888 点此复制	登录下载

设计师学Ai(有课）

文章 2 人气 5.6w

优秀设计师

+关注作者

复制本文链接文章为作者独立观点不代表优设网立场，未经允许不得转载。

继续阅读本文相关话题

AIGC

学AI

AI导航

发表评论为下方 5 条评论点赞，解锁好运彩蛋

以上留言仅代表用户个人观点，不代表优设立场

评论就这些咯，让大家也知道你的独特见解立即评论

菜单 优设网uisdc.com 优设网 - 学设计上优设

您还未登录

登录后即可体验更多功能

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

2024/02/27 推荐： 设计师学Ai(有课）阅读 2.5w 评论有奖 阅读本文需 10 分钟

新模型 Stable Diffusion 3 与 Stable Cascade 全面解析

一、前言

二、效果对比（Cascade 模型与 SDXL 模型）

三、Cascade 模型是什么？

四、Cascade 的文件结构

五、使用 Cascade 模型的流程和工作流搭建

最后总结

结语

设计师学Ai(有课）

文章 2 人气 5.6w

继续阅读本文相关话题

5.6w人气 2文章

本文3套知识9图

一键生成动漫壁纸！还原角色+壁纸变现全流程！

AI生成UI游戏系列！9组恶灵骑士UI界面风格探索！

盲盒私人定制！ChatGPT-4o盲盒制作小技巧！

文章目录

文章目录

你即将学会 平面设计 的知识

同一套文案，如何轻松设计3张海报？

3.8w 人阅读

上一篇

你即将学会 AIGC 的知识

从 Sora 的发展史，聊聊设计师如何面对 AI 焦虑

2.0w 人阅读

下一篇

发评论！每天赢奖品

点击 登录 后，在评论区留言，系统会随机派送奖品

2012年成立至今，是国内备受欢迎的设计师平台，提供奖品赞助 联系我们

AIGC互联网产品设计实践

已累计诞生 701 位幸运星

发表评论 为下方 5 条评论点赞，解锁好运彩蛋

↓ 下方为您推荐了一些精彩有趣的文章热评 ↓

夏花生

五幺六

百度MEUX

58UXD

夏花生

优设推荐官精选热门话题

PS教程

文章 831

AI创作

文章 405

用户体验设计

文章 554

神器推荐

文章 909

评论

收藏

分享

AI趋势

入站必看

设计入门

进阶提升

热门资源

最新AI工具

300+实用AI工具全收录

Midjourney

会上瘾的AI绘画工具

AI智能绘画

让AI助你一臂之力

Blender

称心如意的3D设计法宝

Figma

令设计师爱不释手

HMI设计指南

车载设计教科书

直播间设计

生意都在直播间啦

Stable Diffusion

最强开源AI绘画工具

优设热榜

每日必读的行业消息

教你做字库

每个公司都可有字库

菜单优设网 - 学设计上优设

2024/02/27 推荐：设计师学Ai(有课）阅读 2.5w 评论有奖阅读本文需 10 分钟

你即将学会平面设计的知识

点击登录后，在评论区留言，系统会随机派送奖品

2012年成立至今，是国内备受欢迎的设计师平台，提供奖品赞助联系我们

发表评论为下方 5 条评论点赞，解锁好运彩蛋