ComfyUI 怎么用?SD 节点式工作流入门教程
ComfyUI 怎么用?详解 ComfyUI 教程、SD 工作流、ComfyUI 入门三大基础,节点式 Stable Diffusion 进阶玩法保姆教程
ComfyUI 怎么用?这是用过 AUTOMATIC1111 WebUI 之后,想进阶玩 Stable Diffusion 的人最先碰到的工具。节点式工作流——听起来玄乎,本质就是「把画图流程拆成可视化积木」,可控性比 WebUI 高一个量级,代价是学习曲线陡。
这篇按「ComfyUI 是什么 → 安装 → 第一个工作流 → 节点逻辑 → 进阶用法 → 常见坑」6 段把 ComfyUI 入门讲透。看完你能跑通第一个文生图工作流,并知道它和 WebUI 的根本区别。
前置:本文假设你已经熟悉 Stable Diffusion 基础(模型、prompt、采样器等概念)。没接触过 SD 的人先看 Stable Diffusion 本地部署 再回来。
30 秒了解:ComfyUI 是什么
ComfyUI 是一个基于「节点 + 连线」的 Stable Diffusion 操作界面,每个功能模块是一个节点,节点之间用线连,整个画面就是一张「画图流程图」。
ComfyUI vs WebUI 的根本区别
| 维度 | AUTOMATIC1111 WebUI | ComfyUI |
|---|---|---|
| 界面形式 | 表单 + 按钮 | 节点 + 连线 |
| 上手难度 | 中等 | 高 |
| 可控性 | 中等 | 极高 |
| 工作流复用 | 模板有限 | 完整工作流可导出 / 分享 |
| 高级玩法(多模型组合 / 蒙版 / ControlNet 串联) | 麻烦 | 天生友好 |
| 显存效率 | 一般 | 更高(同硬件能跑更大模型) |
| 速度 | 中等 | 更快 |
| 适合人群 | 普通玩家 | 专业用户 / 工作流定制 |
简单记:WebUI 像 Word(功能齐全,按钮固定),ComfyUI 像 Figma(节点自由组合,能搭出 Word 做不到的事)。
适合谁
- 已经用过 SD WebUI 想突破能力上限的人
- 商业 / 客户项目要做「同一套流程批量出图」的人
- 喜欢节点式工具(用过 Blender / Houdini / Substance 的会很熟悉)
- 显存紧张想榨干硬件性能的人
- 想学最新 SD 玩法(Flux、SD 3.x 等大多先在 ComfyUI 上线)
不适合谁
- 完全没碰过 SD 的小白(先去用 WebUI / 在线工具)
- 只是偶尔画几张图,不打算深耕的人
- 觉得「装软件 = 双击安装包」的人
准备工作
硬件要求(和 SD WebUI 基本一致)
| 部件 | 最低 | 推荐 |
|---|---|---|
| 显卡 | NVIDIA 4GB | NVIDIA 8GB+ |
| 显存 | 4GB | 8GB / 12GB / 16GB |
| 内存 | 8GB | 16GB+ |
| 硬盘 | 30GB | 100GB+ SSD |
| 系统 | Windows 10/11 / Linux / Mac M 系列 | 同上 |
ComfyUI 在 Mac M 系列原生支持比 WebUI 更友好,Mac 用户也能用(Windows AMD 兼容性仍差)。
已有 SD WebUI 的可以复用模型
如果你已经装过 AUTOMATIC1111 WebUI,所有模型(checkpoint、LoRA、VAE、ControlNet 等)都能直接给 ComfyUI 用,不用重新下。只需配置一下模型路径(详见下文步骤)。
详细操作步骤
第 1 步:下载 ComfyUI
最快的方式是用官方便携版:
- 打开 ComfyUI 的 GitHub Release 页面(github.com/comfyanonymous/ComfyUI)
- 找最新版的 Windows portable(约 1-2GB)
- 下载 .7z 压缩包到本地
进阶用户也可以选 git clone + 手动装依赖,但便携版对新手最友好。
第 2 步:解压到英文路径
- 用 7-Zip 解压到一个全英文路径(比如
D:\AI\ComfyUI) - 避免中文路径或空格,否则可能报错
解压完得到一个 ComfyUI_windows_portable 文件夹,里面有 run_nvidia_gpu.bat 等启动脚本。
第 3 步:放入模型
ComfyUI 的模型目录在 ComfyUI_windows_portable\ComfyUI\models\ 下,按子目录分类:
checkpoints\放主模型(.safetensors)loras\放 LoRAvae\放 VAEcontrolnet\放 ControlNet 模型embeddings\放 Textual Inversion
已有 WebUI 的话:编辑 ComfyUI\extra_model_paths.yaml.example → 重命名为 extra_model_paths.yaml → 改 base_path 指向你的 WebUI 路径 → 所有模型直接共享。
[此处放截图:extra_model_paths.yaml 配置示例]
第 4 步:启动 ComfyUI
回到 ComfyUI_windows_portable 文件夹,双击 run_nvidia_gpu.bat(NVIDIA 显卡)或 run_cpu.bat(无独显,慢)。
第一次启动会自动初始化,几十秒后浏览器会自动弹出 ComfyUI 界面(或访问终端显示的 URL,通常 http://127.0.0.1:8188)。
[此处放截图:ComfyUI 启动后的界面]
第 5 步:理解默认工作流
ComfyUI 启动后会有一个默认工作流模板,包含这几个核心节点:
| 节点 | 作用 |
|---|---|
| Load Checkpoint | 加载主模型 |
| CLIP Text Encode(正面) | 写正向 prompt |
| CLIP Text Encode(负面) | 写 negative prompt |
| Empty Latent Image | 设置画布大小(宽 / 高 / 数量) |
| KSampler | 采样器核心(steps / cfg / 采样方法 / 种子) |
| VAE Decode | 把潜空间结果转成实际图片 |
| Save Image | 保存出图 |
节点之间用有色线条连接,线的颜色表示数据类型(红色 = MODEL、紫色 = CONDITIONING、粉色 = LATENT、蓝色 = IMAGE 等)。
[此处放截图:ComfyUI 默认工作流节点关系图]
第 6 步:跑第一张图
操作:
- Load Checkpoint 节点里选你下好的模型
- CLIP Text Encode(正) 写 prompt(如
a cute orange cat, photorealistic, 8k) - CLIP Text Encode(负) 写 negative(如
low quality, blurry) - Empty Latent Image 设宽高(如 512×512)
- KSampler 检查参数(steps 20、cfg 7、sampler dpmpp_2m_karras 是合理默认)
- 点右上角 Queue Prompt 出图
出图后 Save Image 节点会显示图片,同时自动保存到 output\ 文件夹。
[此处放截图:ComfyUI 第一张出图结果]
第 7 步:修改 / 复用工作流
ComfyUI 的核心价值是整张工作流可以保存:
- 右上角 Save 把当前工作流存为 .json
- 下次 Load 直接加载,不用重搭
- 把 .json 发给朋友,他们能完整复刻你的画图流程
社区里大量分享的工作流文件(civitai、OpenArt 等都有),新手起步推荐先下别人成熟的工作流学,不要从零搭。
5 个 ComfyUI 进阶玩法
玩法 1:多模型串联(A 模型出底图 → B 模型微调)
WebUI 一次只能用一个 checkpoint,ComfyUI 可以同一工作流里用多个:
- 第一阶段用「写实模型」出底图
- 第二阶段用「细节增强模型」精修
- 第三阶段用「LoRA」加风格
每个阶段是一组节点链,整体工作流像流水线。
玩法 2:ControlNet 多张参考图叠加
ControlNet 让你用一张参考图控制构图 / 姿势 / 边缘,ComfyUI 让你同时挂多张 ControlNet:
- ControlNet 1:用一张姿势骨架图控制人物动作
- ControlNet 2:用一张深度图控制场景距离感
- ControlNet 3:用一张线稿控制建筑边缘
三个 ControlNet 节点的输出合并喂给 KSampler,AI 同时遵守 3 个约束出图。
玩法 3:批量出图工作流
ComfyUI 天生支持批量节点:
- 用一个 List 节点列出 10 个不同 prompt
- 用 Iterator 节点循环
- 每轮自动出图 + 自动命名保存
一次 Queue 跑出 10 张不同主题的图,非常适合内容矩阵生产。
玩法 4:图生图 + 局部重绘工作流
ComfyUI 把图生图、局部重绘等流程全部节点化:
- 加载参考图节点
- 蒙版生成节点
- 局部去噪节点
- 边缘融合节点
- 整体重绘节点
每一步都可视化、可调、可保存。专业精修工作流的标准玩法。
玩法 5:导入社区成熟工作流
ComfyUI 最强生态是「别人搭好的工作流」。常见来源:
- civitai.com 的「workflows」分类
- openart.ai 的 ComfyUI workflow 区
- GitHub 上 awesome-comfyui 仓库
- 公众号 / B 站作者分享的 .json 文件
直接 Load 别人的工作流,把模型路径改成你自己的,就能复刻 SOTA 玩法。
常见坑 + 解决办法
| 现象 | 原因 | 解决 |
|---|---|---|
| 启动时报错 CUDA out of memory | 显存不够 | 减小图尺寸 / 用 fp16 模型 / 启动加 --lowvram |
| 看不到模型 | 路径不对 / 没重启 | 确认在 models\checkpoints\ 下,Reload Node 刷新 |
| 节点报红 | 节点之间数据类型不匹配 | 看红色提示,按提示加转换节点或换连接 |
| 自定义节点装了不显示 | 缺依赖 / 没重启 | 看终端报错,pip 装依赖或重启 ComfyUI |
| 出图速度慢 | 工作流过于复杂 | 简化节点链 / 升级显卡 |
| 别人的工作流跑不通 | 缺自定义节点或模型 | 看缺什么按提示装,ComfyUI Manager 插件能一键安装 |
| 启动后浏览器没弹出 | 防火墙 / 端口被占 | 手动开 http://127.0.0.1:8188 |
强烈建议装 ComfyUI Manager 插件——这是 ComfyUI 生态的「应用商店」,一键安装节点、模型、工作流,对新手友好度大幅提升。
实战案例:搭一个「人物 + 风格」工作流
下面给一个具体场景:做一个「人物动作 + 油画风格」组合的工作流。
ComfyUI 实战 - 人物动作 + 油画风格工作流
目标:用一张姿势参考图 + 一段 prompt,输出风格统一的油画人像
节点结构(从左到右连接):
Load Checkpoint
- 选一个写实主模型(如 RealisticVision V5.x)
- 输出 MODEL、CLIP、VAE 三条线分别接到下游
Load LoRA
- 加载一个油画风 LoRA(civitai 找 oil painting LoRA)
- 串在 Load Checkpoint 和后续节点之间
CLIP Text Encode(正向)
- prompt:a young woman in elegant pose, classic oil painting, Renaissance style, dramatic lighting, masterpiece
CLIP Text Encode(负向)
- prompt:low quality, blurry, deformed, modern, cartoon, 3d render
Load Image
- 上传一张姿势参考图(你想模仿的姿势)
ControlNet OpenPose
- 模型选 control_v11p_sd15_openpose
- 输入接 Load Image
- 输出接到下面的 Apply ControlNet
Apply ControlNet
- 输入 CONDITIONING(正向 CLIP 输出)+ ControlNet 模型 + 参考图
- strength 设 0.8
- 输出接 KSampler 的 positive 输入
Empty Latent Image
- 宽 512 高 768
KSampler
- steps: 28
- cfg: 7
- sampler: dpmpp_2m_karras
- seed: -1(随机)
- 接受 MODEL(来自 Load LoRA)+ positive(来自 Apply ControlNet)+ negative(CLIP 负)+ latent
VAE Decode
- 输入 KSampler 的 LATENT 输出
- VAE 来自 Load Checkpoint
Save Image
- 输入 VAE Decode 的 IMAGE 输出
- 文件名前缀:oil_portrait_
运行流程:
- 上面节点全部搭好(约 15-20 分钟,新手第一次更久)
- 点 Queue Prompt 跑一次
- 出图后调整:
- 风格太弱 → 调高 LoRA 权重
- 姿势不准 → 调高 ControlNet strength
- 整体太暗 → 改 prompt 加 well lit
- 满意后 Save 整个工作流为 oil_portrait_workflow.json
- 下次直接 Load + 换参考图 + 跑 = 同样风格新人像
这个工作流跑通后,你就拥有了一个”个人风格化人像生成器”——换姿势图就出新图,风格永远统一。这就是 ComfyUI 比 WebUI 的核心价值:沉淀流程而非沉淀图。
ComfyUI 学习路径建议
新手到熟练的合理节奏:
| 阶段 | 时长 | 目标 |
|---|---|---|
| 第 1 周 | 5-10 小时 | 装好、跑通默认工作流、出第一张图 |
| 第 2-3 周 | 10-20 小时 | 看懂节点、改默认工作流、试 LoRA / ControlNet |
| 第 1 个月 | 30+ 小时 | 能从零搭基础工作流、装 Manager 玩社区资源 |
| 第 2-3 个月 | 50+ 小时 | 能搭多模型 / 多 ControlNet 组合工作流 |
| 3 个月后 | 持续 | 能为客户 / 项目设计专属工作流 |
学习材料:ComfyUI 官方 GitHub Wiki、civitai 工作流区、B 站的 ComfyUI 系列教程。英文 YouTube 资源最多最及时。
一个判断「我要不要学 ComfyUI」的 prompt
把下面发给 ChatGPT / 豆包 / DeepSeek:
我在考虑要不要学 ComfyUI,请帮我做一个具体判断。
我的情况:
- 我目前的 SD 经验:「没用过 / 用过 WebUI / 用过其他 AI 画图工具」
- 我的目的:「学习探索 / 做客户项目 / 做内容矩阵 / 玩二次元同人 / 单纯好奇」
- 我对学习成本的接受度:「能花 1-2 个月折腾 / 只想 1 周搞定 / 介于之间」
- 我每周大约画多少图:「5 张以内 / 5-20 / 20-50 / 100+」
- 我是否需要「同一套流程批量产图」:「需要 / 不需要 / 不确定」
请帮我:
- 给一个明确判断:学 / 不学 / 先用 WebUI 半年再说
- 如果学,推荐的入门路径(资源 + 时间分配)
- 如果不学,推荐的替代方案
- 提醒我有什么坑要注意
请直接给一个明确判断,不要让我做选择题。
九成新手得到的建议会是:「先用 WebUI 跑 100 张图打基础,再决定要不要进 ComfyUI」。这就对了——ComfyUI 是「重度玩家的飞跃」,不是「新手的捷径」。
进阶 / 下一步
- Stable Diffusion 本地部署 - SD WebUI 基础(先这个)
- Midjourney 怎么用 - 闭源天花板对比
- 即梦 AI 怎么用 - 国产免费替代
- GPT Image 教程 - ChatGPT 内置画图
- AI 画图选哪个 - 完整选型决策
最后一句忠告:ComfyUI 是 SD 生态的天花板,但天花板对应的也是「学习投入的地板」。如果你打算长期做 AI 视觉工作、产品化能力、或者搞最新 SD 玩法(Flux、SD 3.x 等),学它早晚都得学;如果只是偶尔画图,WebUI 或 即梦 AI 完全够用。