第八部分:controlnet插件之 ControlNet插件介绍
关注作者
一、为什么会有ControlNetStable Diffusion 等扩散模型虽然功能强大,但有以下几个明显的不足:1、难以精确控制结果在没有 ControlNet 的情况下,我们生成图像主要依赖文字提示(Prompt)。但是文字描述的结果
Stable Diffusion 等扩散模型虽然功能强大,但有以下几个明显的不足:
1、难以精确控制结果
在没有 ControlNet 的情况下,我们生成图像主要依赖文字提示(Prompt)。但是文字描述的结果很难完全符合预期,特别是对于复杂的细节,如特定的姿态、物体形状等。
例如,我想要生成一个和下图
女生坐在桌子上动作一致的图片,就算我的提示词prompt描述写得很清楚——“一个女生坐在桌子上,双手放在身旁两侧,手掌放在桌面,左脚撑地,右脚微微弯曲”,但是模型可能依然会生成多个不够准确的版本,无法完全符合你的想法。

(2)即使我们可以使用图生图来进一步控制,但这些方法对输入图像的解释较为有限。如果重绘幅度小的话,那这个时候你会发现她不仅动作不变,可能发型衣服都保持不变;如果你的重绘幅度大的话,那可能所有的内容全部都改变了,包括她的姿势。
2、对条件输入支持有限
(1)
对于复杂的细节,如特定的姿态、物体形状等
,用户无法提供利用Stable Diffusion做出更细化的指令, 这限制了模型的创作自由度。
3、基于以上的限制,controlnet插件就应运而生了:
ControlNet 的主要作用是为 Stable Diffusion 添加一种“可控性”,它允许你通过图像或特定条件来引导生成结果,如可以灵活的单一的自由的添加控制维度去对图片的生成进行约束,这就解决了图像生成的随机性过强的问题。比如:
(1)我们可以提供一张草图,让 AI 根据草图生成符合形状的精美图片;
(2)我们可以提取人体姿态信息,让 AI 生成对应姿势的人物图像;
(3)我们可以上传线稿,生成符合线稿的彩色插画;
(4)我们使用深度图,让 AI 按真实的三维效果生成图像。
ControlNet的意义就在于,它可以在Stable Diffusion不进行重新训练的前提下,学会从多个维度控制图片生成。
ControlNet 的“控制”来源于用户在输入图片时选择的不同维度模型信息来(例如草图、人体姿态)进行解读,这些信息会和 Stable Diffusion 原本的模型结合,从而生成图像。每个维度模型专注于不同的功能,例如:
1、线稿控制(Canny Edge)
2、人体姿态控制(OpenPose)
3、深度信息控制(Depth)
4、Scribble(随意涂鸦控制)
这些预训练模型帮助 ControlNet 读取你提供的额外信息,并将它与生成过程相结合,常用的controlnet预训练控制模型如下:

三、使用ControlNet的流程
根据ControlNet的工作原理,我们可以总结出 ControlNet的工作流程如下:
1、首先,输入我们要参考的图片
2、选择我们需要控制的图片维度,也就是controlnet预训练的控制模型,如人体姿态控制、 线稿控制等
3、ControlNet会根据我们选择的控制模型,提取出图片中需要参考的特征
4、输入除特征外的其他提示词
5、结合输入的图片、提示词和参考特征,ControlNet进行理解和学习,最终输出结果图

以下是一些常见的应用场景,适合不同需求的用户:
1、草图到高清图像
(1)场景: 如果你画了一个简单的草图,希望生成精致的画作。
(2)流程: 上传你的草图,选择“Canny Edge”模型,输入文字描述,比如“a beautiful castle in a forest”,AI 会生成一个高清的城堡图。
2、姿态控制
(1)场景: 想要生成特定姿势的人物图,比如跳舞、坐在椅子上。
(2)流程: 使用人体姿态检测工具(比如 OpenPose)生成姿态图,上传到 ControlNet,让 AI 按此姿态生成符合的图像。
3、深度控制
(1)场景: 想要生成具有真实感的三维效果图片,比如建筑物或人物。
(2)流程: 使用深度检测工具生成深度图,上传后,AI 按三维信息生成图片。
4、 涂鸦变艺术作品
(1)场景: 用鼠标随便画了一些涂鸦,想让 AI 把它变成一幅艺术作品。
(2)流程: 上传涂鸦图,选择合适的模型,描述想要的风格,AI 就能生成对应的艺术画
1、优势
(1)高精度: 你可以用额外的输入信息精准控制图像生成。
(2)多样性: 支持各种不同的条件输入,功能强大。
(3)灵活性: 能用简单的图像引导生成复杂的艺术作品。
2、局限性
(1)学习成本: 对小白来说,可能需要适应插件的操作和模型选择。
(2)硬件需求: 需要性能较强的 GPU,处理复杂任务可能会耗费较多资源。
ControlNet 插件极大地扩展了 Stable Diffusion 的功能,使得生成内容的过程更加可控和灵活。在本节课中,我们已经对
ControlNet 插件有一个基本的了解了,那在下节课程中将会继续讲解如何安装和使用 ControlNet。
暂无评论,快来抢沙发~
热门文章
相关推荐
Copyright 2026 aixinshou.cn 正在备案中
也留下自己的观点?