只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

2024/11/18 推荐： Infinite AI阅读 2.4w 评论有奖阅读本文需 9 分钟

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

好看又好用！5 款高质量的 Flux Lora 模型推荐

大家好，这里是和你们一起探索 AI 的花生~ 这几天一直在高强度学习 Flux 的相关内容，前面为大家详细介绍了 Flux 生态的最新内容，今天再推荐一些我发现的质量非常不错的 Flux Lora，包含写实、插画等多种风格，其中一些对提升 Flux 的出图效果非常有帮助，一起来看看吧~

阅读文章 >

SD-Lora 模型炼制基本介绍

在 AI 生成的浪潮中，Stable Diffusion （SD）模型配以 Lora（低秩自适应）算法，为创作者开辟了一条低成本、高效率的个性化模型定制路径。

相较于从头训练大型生成模型，Lora 通过在预训练模型的基础上进行轻量级微调，显著降低了计算资源的需求和时间成本。同时保持了生成内容的高质量与独特性。

由于Lora 模型的炼制流程较为复杂且涉及较多的概念。因此，我们将分为上下期来向大家介绍 Lora 模型的炼制流程。

本次我们将先介绍 Lora 模型炼制的前期准备、参数设置和打标签。

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

一般来说，底模的炼制需要借助大约 10～20 万张相关的图片进行炼制。而借助相对成熟的底模则可大大降低炼制图片数量。且炼制方式和流程与线下炼制流程基本保持一致。

我们使用平台 Liblib.AI 的 Lora 模型，进行 SD-Lora 模型训练流程的一般化讲解。这不仅简化炼制方式、降低炼制成本且在细节上可以实现更好的私人化处理。

以下展示的就是 Liblib.AI 的 Lora 模型的展示界面。点击「训练我的 LoRA」即可开始

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

一、前期准备

Lora 模型训练前期准备，需要完成数据集准备、模式选择以及内容选择。

数据集准备：生成目标图片时，需要确定适合的模型系列（SD 1.5 或者 SDXL），并将参考图片裁剪为对应尺寸。

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

模式选择：在 Liblib·AI 的训练平台中，提供「自定义」，「XL」，「人像」，「ACG」，「画风」这四种模式。这四种模式在训练平台上会导致默认选择的底模不同，同时也在预览的提示词上也会有不同。四种基础模式也决定了炼制 Lora 模型需要的数据集图片数量。

我们综合估量各类训练平台的模式，实现相对精准的模型训练。总结出四类 Lora 模型所需的图片数量。所需数量展示如下：

自定义/SDXL（一般）：15～30 张；
人像（Character）：10～50 张；
画风（Style）：100～4000 张（在线炼制平台一般支持的上限是 2000 张）；
概念（Concept）：50～2000 张。

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

其中，Liblib·AI 中 ACG 模式所需图片数量与画风（Style）一致。

内容选择：训练 Lora 模型时，需要确定训练所需的参考图。其中需要考虑关于主体物不同维度的选择：

不同角度；不同表情姿势；不同光线场景；高清图片。

以人像为例，在图片选择的时候，需要采用：

不同的面部表情；
不同的服装；
不同的姿态；
不同的手的造型（如果有必要的话，可以增加专门手的图片）。

二、参数设置

在 Liblib·AI 平台中，参数设置分为三个部分：底模选择，参数选择，模型效果预览提示词。

底模选择：Lora 模型的炼制需要借助对应的大模型（checkpoint），即底模。目前的底模大体上可以分为 SD1.5 和 SDXL 两个系列，目前虽然 SD3 已经上线，但其他配套的模型尚未成熟，故不在本次的介绍范围之内。

而 SD1.5 和 SDXL 这两个系列的区别目前仅在与生成图片的效果，一般来说 SDXL 系列的模型生成效果会更好。但是 SD1.5 系列的 Lora 模型适配的相关插件会更加全面。

以生成 3D 图标的 Lora 模型为例，目前线上专注于 3D Icon 的底模一般采用 BDicon 和 DDicon 这两个模型，如下所示：

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识

当然，不是所有的主题都能找到对应的底模。如果没有完全对应的底模的话，可以使用基础模型，即 SD1.5 基础模型和 SDXL 基础模型。

参数选择：相关参数分为基础参数和高级参数，大部分时候只需要调整基础参数的单张次数「Repeat」和循环轮次「Epoch」就能获得很不错的效果。重复率越高，人工智能就能更好的读懂图片，但实训中，重复过高会导致过拟合，也就是学习过头，对图片认知固化，失去发散的能力。且需要更高的算力，更多时间。相关参数的调整规则如下：

Repeat 重复常规建议训练参数:10-15
Epoch 常规建议训练参数:10-15

模型效果预览提示词：在模型训练时，选择准确的提示词能达到事半功倍的效果。我们通常选择相对简单的预期效果的正向提示词（Prompt），因为这里的提示词生成的预览图的效果基本会和模型的训练效果相关。

只要三分钟，让你快速掌握 SD-Lora 模型炼制的基础知识