第三部分：SD各类模型精讲之 SD模型分类介绍_Stable Diffusion使用教程

返回分类首页

第三部分：SD各类模型精讲之 SD模型分类介绍

关注作者

admin
2026-04-30 11:32:44

Stable Diffusion模型可以生成各种风格和类型的图像，包括写实风格、艺术风格、动漫风格等，满足了用户多样化的创作需求。引入Stable Diffusion模型后，图像生成的质量可以显着提升。模型可以生成高分辨率、细节丰富且逼真的

Stable Diffusion模型可以生成各种风格和类型的图像，包括写实风格、艺术风格、动漫风格等，满足了用户多样化的创作需求。
引入Stable Diffusion模型后，图像生成的质量可以显着提升。模型可以生成高分辨率、细节丰富且逼真的图像，极大地提高了工作效率和创作水平。

一、Stable Diffusion模型分类

在Stable diffusion中，模型主要分为五大类，分别是Stable diffusion模型、VAE模型、Lora模型、Embedding模型以及Hypernetw ork模型。

1、 SD大模型（Stable Diffusion大模型）
这是最基础也是最通用的Stable Diffusion模型，通常经过大规模的多样化数据训练，能够生成高质量的各种类型图像。比如某个大模型的风格偏向于二次元的，那么使用它生成的图片效果就是二次元风格的；如果大模型是真实性照片类型的风格，那么生成出来的图片质量就偏向于真人。

2、 VAE模型（Variational Autoencoder模型）
VAE是一种生成模型，通过编码器将输入数据压缩成潜在变量，再通过解码器重建图像。这种模型可以简单理解为起到一个滤镜的效果。在生成图片的过程中，主要影响的是图片的颜色效果。

3、 LoRA模型（Low-Rank Adaptation模型）
LoRA模型通过对原始模型的低秩近似来进行高效的模型适应，能够在保持模型性能的同时减少计算资源的消耗。简单来说，它的作用是让这些庞大的模型变得更加灵活和高效，能够在特定任务上进行优化（比如对样式进行一些修改），而不需要从头开始训练整个模型。

需要注意的是，Lora模型并不能单独使用，它必须与前面的大模型一起使用。另外，由于Lora训练的图片较少，所以它的体积一般不会很大，一般在几十到几百MB之间，这样大大节省了磁盘的占用量。

4、 Embedding模型
Embedding模型通过将输入数据映射到一个连续的、低维的嵌入空间，从而捕捉数据之间的语义关系和结构。此类模型能够更好地理解和生成具有复杂语义的图像。

简单来说，如果我们要通过SD生成火影里面的鸣人形象，我们需要好几个提示词来进行描述，比如什么外形，穿什么颜色的衣服，而Embedding就是将这一系列提示词打包成为一个新的提示词，假设叫鸣人。
这样后续我们只要引入这个 Embedding模型，然后输入鸣人提示词，就会生成我们想要的鸣人形象，提高了写提示词的效率！
由于Embedding模型只是将提示词整合了，所以它的体积非常小，一般在几十到几百KB之间。

5、 Hypernetwork模型
Hypernetwork模型通过生成一组用于目标模型参数的权重，来控制和调整目标模型的行为。此类模型可以在不同任务之间共享知识，提高模型的通用性和灵活性。
Hypernetwork可以用来对模型进行微调，比如在Stable Diffusion这样的图像生成模型中，通过插入一个小型的超网络来修改输出风格，而不改变原始模型的核心结构。这个模型的作用其实和Lora模型功能有点重叠。

二、模型后缀

在Stable diffusion中，有两种比较常见的模型后缀，分别是.ckpt和.safetensors。

原本的模型的后缀是.ckpt的，但是因为这类模型很容易被人植入恶意代码，导致风险，所以后面就出了后缀.safetensors的模型，这种格式的文件只保存模型的权重，而不包含优化器状态或其他信息，这也就意味着它通常用于模型的最终版本，当我们只关心模型的性能，而不需要了解训练过程中的详细信息时，这种格式便是一个很好的选择。

由于 .safetensors 只保存模型的权重，没有代码，所以会更安全；另外由于保存的信息更少，所以它的体积也比 .ckpt 小，加载也更快，所以目前是比较推荐使用 .safetensors 的模型文件。

看看别人的观点?