第三部分:SD各类模型精讲之 SD模型分类介绍

  • admin
  • 2026-04-30 11:32:44

Stable Diffusion模型可以生成各种风格和类型的图像,包括写实风格、艺术风格、动漫风格等,满足了用户多样化的创作需求。引入Stable Diffusion模型后,图像生成的质量可以显着提升。模型可以生成高分辨率、细节丰富且逼真的

Stable Diffusion模型可以生成各种风格和类型的图像,包括写实风格、艺术风格、动漫风格等,满足了用户多样化的创作需求。
引入Stable Diffusion模型后,图像生成的质量可以显着提升。模型可以生成高分辨率、细节丰富且逼真的图像,极大地提高了工作效率和创作水平。

一、Stable Diffusion模型分类

在Stable diffusion中,模型主要分为五大类,分别是Stable diffusion模型、VAE模型、Lora模型、Embedding模型以及Hypernetw ork模型。

1、 SD大模型(Stable Diffusion大模型)
这是最基础也是最通用的Stable Diffusion模型,通常经过大规模的多样化数据训练,能够生成高质量的各种类型图像。比如某个大模型的风格偏向于二次元的,那么使用它生成的图片效果就是二次元风格的;如果大模型是真实性照片类型的风格,那么生成出来的图片质量就偏向于真人。

2、 VAE模型(Variational Autoencoder模型)
VAE是一种生成模型,通过编码器将输入数据压缩成潜在变量,再通过解码器重建图像。这种模型可以简单理解为起到一个滤镜的效果。在生成图片的过程中,主要影响的是图片的颜色效果。

3、 LoRA模型(Low-Rank Adaptation模型)
LoRA模型通过对原始模型的低秩近似来进行高效的模型适应,能够在保持模型性能的同时减少计算资源的消耗。简单来说,它的作用是让这些庞大的模型变得更加灵活和高效,能够在特定任务上进行优化(比如对样式进行一些修改),而不需要从头开始训练整个模型。

需要注意的是,Lora模型并不能单独使用,它必须与前面的大模型一起使用。另外,由于Lora训练的图片较少,所以它的体积一般不会很大,一般在几十到几百MB之间,这样大大节省了磁盘的占用量。

4、 Embedding模型
Embedding模型通过将输入数据映射到一个连续的、低维的嵌入空间,从而捕捉数据之间的语义关系和结构。此类模型能够更好地理解和生成具有复杂语义的图像。

简单来说,如果我们要通过SD生成火影里面的鸣人形象,我们需要好几个提示词来进行描述,比如什么外形,穿什么颜色的衣服,而Embedding就是将这一系列提示词打包成为一个新的提示词,假设叫鸣人。
这样后续我们只要引入这个 Embedding模型,然后输入鸣人提示词,就会生成我们想要的鸣人形象,提高了写提示词的效率!
由于Embedding模型只是将提示词整合了,所以它的体积非常小,一般在几十到几百KB之间。

5、 Hypernetwork模型
Hypernetwork模型通过生成一组用于目标模型参数的权重,来控制和调整目标模型的行为。此类模型可以在不同任务之间共享知识,提高模型的通用性和灵活性。
Hypernetwork可以用来对模型进行微调,比如在Stable Diffusion这样的图像生成模型中,通过插入一个小型的超网络来修改输出风格,而不改变原始模型的核心结构。这个模型的作用其实和Lora模型功能有点重叠。

二、模型后缀

在Stable diffusion中,有两种比较常见的模型后缀,分别是.ckpt和.safetensors。

原本的模型的后缀是.ckpt的,但是因为这类模型很容易被人植入恶意代码,导致风险,所以后面就出了后缀.safetensors的模型,这种格式的文件只保存模型的权重,而不包含优化器状态或其他信息,这也就意味着它通常用于模型的最终版本,当我们只关心模型的性能,而不需要了解训练过程中的详细信息时,这种格式便是一个很好的选择。

由于 .safetensors 只保存模型的权重,没有代码,所以会更安全;另外由于保存的信息更少,所以它的体积也比 .ckpt 小,加载也更快,所以目前是比较推荐使用 .safetensors 的模型文件。

看看别人的观点?

也留下自己的观点?

精彩评论

暂无评论,快来抢沙发~