Skip to content

掌握Stable Diffusion图生图:参数解析与进阶技巧

在这一课里,我们将深入剖析 WebUI 的各项参数,包括分辨率、批次数量、采样器、迭代步数等。你将明白这些参数如何影响生成效果与效率,并学会如何结合模型最佳分辨率来避免常见问题。课程还会带你认识采样的原理和不同算法的差异,让你能更灵活地调整参数,提升作品的质量与可控性。

这是一份基于视频内容整理的 Stable Diffusion“图生图”功能入门教程文档。


在 AI 绘画中,除了使用提示词(Prompt)引导生成,我们还可以提供一张图片,让 AI 基于这张图片的形象、构图和色彩信息生成新的图片。这个过程被称为“图生图” 。

  • 核心优势:相比纯粹的“文生图”,图生图能更好地控制画面的构图和人物形态,有效降低生成的随机性,更容易得到理想的画面。
  • 工作原理:AI 提取原图的结构和颜色信息,按一定比例混合进噪声图中,使生成的新图片在对应区域呈现出与原图相似的特征。

以下是将一张普通图片通过 SD WebUI 进行重绘的标准步骤:

  • 进入功能区:在 WebUI 中切换到“图生图 (img2img)”标签页。
  • 上传图片:点击上传区域选择文件,或直接将图片拖拽至该区域。
  • 填写提示词:像文生图一样,输入描述画面内容的提示词(如描述人物着装、动作、背景等) 。
  • 设置尺寸
    • 建议生成尺寸与原图比例一致。
    • 可以点击宽高设置旁边的“小标尺”图标,自动读取原图尺寸。
    • 若原图过大,建议使用“按比例缩放”功能,将其缩小至合适的生成分辨率(如 600x800)以避免显存不足或多人多头问题。
  • 点击生成:AI 将根据原图和提示词生成新的图像。

3. 核心参数详解:重绘幅度 (Denoising Strength)

Section titled “3. 核心参数详解:重绘幅度 (Denoising Strength)”

这是图生图中最关键的参数,用于控制生成图与原图的相似程度。

1.定义:也称“去噪幅度”,控制将原图混合进噪声的比例。

2.数值影响

  • < 0.5 (低幅度):画面几乎无变化,常用于放大修复,保持画面一致性。
  • 0.6 左右 (较低幅度):生成结果与原图高度相似,细节(如头巾、衣服)更准确,但 AI 发挥空间小,结果可能千篇一律。
  • 0.75 (默认值):平衡数值,既保留原图特征,又允许 AI 产生适当的变化。
  • 0.8 - 0.9 (高幅度):生成结果与原图差异较大,适合需要发散创意的场景。
  • 1.0 (最大值):完全忽略原图,效果等同于文生图。

当上传图片的比例与设置的生成比例不一致时,WebUI 提供四种处理方式:

  • 拉伸 (Just resize):默认模式。直接拉伸原图以适应新尺寸(例如将竖图拉宽成正方形),会导致物体变形(如变胖)。
  • 剪裁 (Crop and resize):按比例裁切原图,可能会切掉部分主体(如头顶或衣服)。
  • 填充 (Resize and fill):保留原图完整性,在多余的空白处进行延伸填充。但填充内容由 AI 自由发挥,可能会出现不协调的画面。
  • 浅空间 (Just resize (latent upscale)):原理上与拉伸类似,但在底层操作上有所不同。

图生图可以作为控制构图的手段。在保持原图构图不变的情况下,通过修改提示词来改变特定元素。

案例:将衣服颜色改为蓝色,或将背景修改为城市街道,生成图会保留原图的人物姿态,但改变环境和着装。

通过切换大模型(Checkpoint),可以将图片在不同次元间转换。

  • 三次元转二次元:上传真人照片,切换到二次元模型(如 MeinaMix),适当降低重绘幅度,即可生成二次元风格的“世界名画”。
  • 二次元转三次元:反之亦然,取决于使用的模型和提示词。

你不需要精湛的画工,只需提供一个简单的草图,即可生成高质量插画。

操作方法

  • 在画图软件(如 PS 或 画图板)中绘制简易色块草图(如蓝天、绿地、雪山、长椅上的人)。
  • 导入 WebUI 图生图界面。
  • 输入对应的提示词描述场景。
  • AI 会根据色块分布和提示词生成细节丰富的精美插画。

解锁 Pro 权限

您正在使用 Lite 体验版。
升级 Pro,立即解锁全站核心工作流、商业源文件
以及后续永久更新。

立即获取密钥