🤖 AI 跟我学 新手入门

ChatGPT 编辑图片怎么用?图生图局部修改实战

ChatGPT 编辑图片怎么用:上传图后用选区或对话描述局部修改、换背景、改风格的全流程,含连续编辑保持一致性的技巧,以及和 Photoshop AI 的取舍。

发布 2026/05/20 📎 参考官方文档

ChatGPT 编辑图片这个能力在 2026 年 4 月 Images 2.0 发布后已经能打——传图进去说一句「把背景换成晴天」就真能换;用画笔圈出某块说「这只手再细一点」也真能改。它最强的不是单次编辑,而是多次编辑里它能记住人物长相、灯光风格、构图基调,不会越改越走样。

这篇手把手讲清 ChatGPT 怎么改图、两种核心编辑路径(选区 vs 对话)、5 个真实可用场景、和 Photoshop 的 Generative Fill 怎么取舍、避免被剧透的常见坑。

30 秒了解 ChatGPT 编辑图片

ChatGPT 编辑图片是把图传上去后让 ChatGPT 局部或整体修改它的功能。 你既能让它改自己生成的图,也能让它改你拍的照片、找到的素材。

两个核心编辑方式:

  • 选区编辑(inpainting):用画笔圈出图里某个区域,告诉它「这一块改成 X」
  • 对话编辑:不用画笔,直接在对话里描述「把背景的车换成自行车」

两者各有优劣,下面会讲清什么场景用哪种。

适合谁用:

  • 想给营销图 / PPT 配图做小修小补的人
  • 想换背景、改颜色、加文字、去除多余元素
  • 想做连续故事图、保持同一角色形象的人
  • 已有 ChatGPT 订阅、不想买 PS 的轻度修图用户

不适合谁:

  • 专业图像编辑(PS / Affinity 仍更精细)
  • 需要像素级 control 的设计师
  • 需要批量自动修图的(用 API 更便宜)

准备工作

开始前要确认:

  • 所有 ChatGPT 账号都能用(含免费)。但 Free 配额很紧(每 24 小时 2-3 次),重度使用建议 Plus。
  • 支持端:Web、iOS、Android、桌面端都行。选区工具在 Web 端体验最好,手机上画笔不准。
  • 图片格式:JPG、PNG、WebP 均可,单张建议小于 20MB。
  • 国内访问:ChatGPT 在中国大陆不开放,需要解决网络。完全可以用国产工具替代:即梦 AI 的图生图、可灵的图片编辑、文心一格都能覆盖大部分场景。

详细操作步骤

第 1 步:上传要编辑的图

打开 ChatGPT 新对话,点输入框左边的 + 号,选 Add photos & files,上传你要改的图。或者直接拖拽到对话框里。

[此处放截图:ChatGPT 输入框上传图片后的预览,红框标注上传按钮]

不限于自己生成的图——你的手机照片、网上下的图、扫描的纸稿都行(注意版权)。

第 2 步(路径 A):用对话直接描述要改什么

最简单的方式:传完图直接发一句话告诉它改什么。例如:

  • 「把背景换成夕阳下的海边」
  • 「这只猫换成黑色」
  • 「在右下角加一行字”AI 跟我学”,黑色粗体」
  • 「整张图改成水彩画风格」
  • 「人物的衣服换成西装」

ChatGPT 会在 30 秒到 2 分钟内出修改后的图。核心元素(人物长相、光线、构图)通常保持不变,这是 Images 2.0 的关键升级。

[此处放截图:上传图片后通过对话修改前后对比]

第 3 步(路径 B):用选区工具精确指定

如果要改的位置比较小或者不容易描述,点图片右上角的”画笔”图标进入选区模式。

[此处放截图:图片选区编辑界面,红框标注画笔工具]

操作:

  1. 用画笔涂抹要改的区域(不需要精确到像素)
  2. 在对话框里写要怎么改这块(例:「把这块改成绿色草地」)
  3. 点发送,等出图

选区编辑的优势:能避免 ChatGPT 误改其他地方。当你说「把背景换掉」但 ChatGPT 改的不是背景而是别的东西时,用选区圈一下最有效。

第 4 步:基于结果继续迭代

修改后的图不满意?直接说要怎么再改:

  • 「这块再蓝一点」
  • 「文字再大一倍」
  • 「人物表情换成微笑」

关键:ChatGPT 会基于”上一张修改后的图”继续改,不会把你前几轮的修改丢掉。这是它比传统 inpainting 工具最大的优势。

第 5 步:保持角色 / 风格一致跨多张图

要做系列图、绘本、营销连图时,ChatGPT 能记住第一张图的角色形象,在后续图里复用

操作:

  1. 上传或生成第一张图
  2. 让它满意之后,发:「请基于上面的人物特征再画一张:[新场景描述],保持人物长相、发型、衣着不变」
  3. 重复以上步骤,每张图都引用前一张

[此处放截图:连续 3 张图保持同一角色形象的对比]

这事在 1.5 时代很难,2.0 之后基本稳定。关键是 prompt 里明确说”保持人物特征”

第 6 步:导出或继续用

修改完点图片右键 / 长按 → 保存。或者让 ChatGPT 把图放到 Canvas 旁边写说明文字,或者让它「按这张图风格再做 5 张系列图」。

5 个 ChatGPT 编辑图片真实可用场景

1. 一键换背景

人像照片要拿来做 LinkedIn 头像?传上去说「把背景换成纯白色,专业商务感,保持人物本身不变」,30 秒拿到新版。

2. 给截图加注释 / 标记

工作截图要发给同事,传上去说「在登录按钮位置画一个红色箭头和一个红框,加文字”点这里登录”」——比开 PS 快 10 倍。

3. 修复老照片

旧照片有划痕、褪色、人物模糊,传上去说「修复划痕、提亮颜色、让人脸更清晰但不要换脸」——是个轻度的旧照修复方案。

4. 营销图小修小补

设计师做完的主视觉,临时要改一行文字 / 换一个颜色,传上去描述要改的点。比让设计师改 5 分钟省一晚等待。

5. 给已有图加文字 / 水印 / 边框

「给这张图右下角加上”@AI 跟我学”水印,半透明白色,圆角 sans-serif 字体,不要遮住主体」——一句话搞定。

常见坑 + 解决办法

现象原因解决
改完整张图都变了描述太宽泛用选区工具圈一块;或 prompt 写”只改 X 不改其他”
人脸跨图变样没明确要求保持prompt 加「保持人物长相、发型、衣着不变」
中文文字渲染错字数太多 / 字体复杂字数控制在 10 字内;要求”大字粗体”
选区改完边界生硬模型融合不完美让它「再融合一次让边界自然」
改了 N 次效果越来越糟累积偏差回到最初那张图重新发 prompt
文件上传失败大于 20MB 或格式不支持压缩到 5MB 以下;改 PNG / JPG
改完图变模糊输出分辨率限制让它「输出更高分辨率版本」

实战案例:把一张大头照改成 3 种不同风格的头像

下面这个 prompt 我自己用过——传一张自己的照片,30 分钟出 3 张可发的不同风格头像。

打开 ChatGPT,上传一张你的清晰大头照,发:

📋 Prompt 模板

我刚上传的是我的一张大头照。请基于这张照片帮我生成 3 张不同风格的头像,每张分别发送,我看完每一张再说”继续”。

整体要求(3 张共同):

  • 必须保留我本人的脸部特征:脸型、五官比例、眼睛、嘴型、发色发型
  • 比例 1:1 正方形
  • 头像构图:肩部以上居中

3 张分别是:

第 1 张:商务专业版

  • 背景:浅灰渐变纯色
  • 服装:深色西装 + 浅色衬衫
  • 光线:柔和侧光,干净专业感
  • 用途:LinkedIn 头像

第 2 张:极简插画版

  • 把照片转成扁平插画风
  • 配色:奶白 + 暖橘 + 蓝灰,参考 Behance 上日系极简风
  • 五官简化但要能认出是我
  • 用途:博客 / 公众号

第 3 张:复古胶片版

  • 整体风格:80 年代杂志封面胶片质感
  • 背景:颗粒感、暖色调、轻微噪点
  • 光线:偏暖、轮廓光
  • 用途:社交媒体艺术感账号

每张画完简单告诉我「保留了哪些原图特征」+「做了哪些风格化处理」,等我确认满意再画下一张。

第一张如果脸不像,直接说「五官再贴近原图一点,下巴线条要保持原图的」——ChatGPT 会基于上一张继续改而不是重画。

进阶玩法:用 ChatGPT 做”连贯绘本式故事图”

下面这个适合做小红书图文连图、PPT 故事板、儿童绘本草稿的场景:

📋 Prompt 模板

我刚上传的图是我希望贯穿整组故事的主角形象——一个戴黄色帽子的小女孩。

请基于这张图,画一组 5 张连贯的故事图,主题是「小女孩和她的橘猫一起学 AI」。

整体一致性要求(必须严格保持):

  • 小女孩的脸、发型、衣着保持和原图完全一致
  • 所有 5 张图配色一致:奶白 + 暖橘 + 浅蓝
  • 风格一致:极简扁平插画
  • 比例 1:1
  • 同一只橘猫贯穿 5 张,外观体型一致

5 张图的内容:

  1. 小女孩坐在书桌前抬头看屏幕里跳出来的 AI 机器人,橘猫蹲在键盘上观察
  2. 小女孩对着电脑说话,屏幕上显示对话气泡,橘猫好奇地伸爪子
  3. 小女孩开心地把电脑屏幕给橘猫看,屏幕上是一张猫的画像
  4. 小女孩在纸上记笔记,橘猫趴在笔记本一角,桌上一杯热可可
  5. 黄昏窗外,小女孩抱着橘猫看屏幕,电脑屏保是星空

执行方式:

  • 一张一张画
  • 画完每张简单确认「保留的一致性元素」
  • 我说”继续”再画下一张
  • 第 5 张画完总结整组在视觉风格上的连贯性

如果某张图里小女孩或橘猫的外观偏离了原图,主动告诉我哪里不一致,问我要不要重画。

这种连续叙事编辑是 ChatGPT 2.0 真正甩开其他工具一截的地方——它有”记忆”,能让你做出过去要请插画师一周才能交付的成稿。

ChatGPT vs Photoshop AI vs 即梦 / 文心一格:怎么选

维度ChatGPT 编辑图片Photoshop Generative Fill即梦 AI
上手成本极低(自然语言)中(需懂 PS)极低
局部精修能力中(画笔粗)强(像素级)
多轮编辑一致性中(手动管理图层)
中文 prompt 友好
国内可访问
价格含 ChatGPT 订阅单独订阅有免费
文字渲染
适合场景营销图 / 系列图 / 快速修改专业修图 / 设计稿中文场景 / 国内

简化结论:

  • 快速改图 + 写文字 + 系列图:ChatGPT 最快
  • 专业精修 / 设计师工作流:PS Generative Fill
  • 国内 + 中文 + 免费:即梦 / 文心一格

下一步:把图像编辑串进你的工作流

编辑图片是创意工作流的中间环节,下面几个方向值得继续看:

一句实话:ChatGPT 编辑图片现在还做不了的事是「像素级专业修图」,但 80% 的日常修图场景它快得离谱。用对几次你就再也不会为换背景、加文字、统一风格这种小事去打开 PS