GPT-5.2 prompt 官方指南:和老模型差在哪
GPT-5.2 prompt 写法和 GPT-4o / 5.1 区别全解读,含 OpenAI 官方推荐的 verbosity 控制、reasoning effort 设置、工具调用规范和 5 个可复制 prompt 模板
GPT-5.2 上线一段时间了,不少人发现:老 prompt 直接搬过来,效果反而比 GPT-5.1 还差。这不是模型变笨了,是 OpenAI 在 5.2 上重新调了”指令理解”的脾气——它现在更”听话”,但你要把话说得更清楚。
这篇就是把 OpenAI 官方那份 GPT-5.2 prompting guide 翻成中文版的人话,告诉你:
- 5.2 跟 5.1 / 4o 比到底改了什么
- 老 prompt 上来必踩的 3 个坑
- 怎么调 reasoning effort 才不浪费 token
- 5 个可以直接复制的 GPT-5.2 prompt 模板
读完你能直接把现有 prompt 升级成”GPT-5.2 友好”版。
30 秒看懂 GPT-5.2 跟老模型的 4 个核心变化
OpenAI 官方在 cookbook 里强调,5.2 跟前一代相比有 4 个明显行为变化:
| 行为 | GPT-5.1 / 4o | GPT-5.2 |
|---|---|---|
| 默认啰嗦程度 | 较啰嗦,喜欢加铺垫 | 默认更精简,直奔重点 |
| 指令字面理解 | 会主动”猜你想要” | 严格按字面执行,不脑补 |
| 中间结构化 | 偶尔加列表 | 默认输出”小标题 + 要点”框架 |
| 模糊问题处理 | 倾向给一个答案 | 倾向列 2-3 种解读让你选 |
简单说:5.2 是个”严肃认真的下属”,你说一你得到一,不会自作主张升级到一加二。
这带来的直接影响是:
- 你以前写「帮我写一份周报」,4o 会脑补一个完整周报;5.2 可能问你”周报给谁看?要不要数据?”
- 你以前让 5.1 “分析这份报告”,它会展开 3000 字;5.2 可能给你 500 字精华
- 你以前模糊地说「优化一下这段代码」,5.2 会反问优化目标(性能?可读性?还是兼容性?)
好消息:输出更精准,幻觉更少 坏消息:你得把 prompt 写得更具体,不能再偷懒
老 prompt 升级 GPT-5.2 必改的 3 件事
改动 1:把”含糊的目标”换成”明确的格式约束”
GPT-5.2 默认会根据任务难度自己调长度。简单查询给短答案,复杂分析给长答案。如果你需要稳定的输出长度,必须在 prompt 里写死。
错误示范:
帮我写一份产品发布通稿
5.2 可能给你 200 字也可能给 2000 字。
正确写法:
帮我写一份产品发布通稿。
要求:
- 总长 400-500 字
- 分 3 段:背景、亮点、可用时间
- 第一段不超过 80 字
改动 2:用”作用域”代替”默认推广”
5.2 不会把一条指令”默认推广到所有地方”。比如你说”把第一段改成口语化”,它真的只改第一段,不会自动把后面也改了。
OpenAI 的原话叫 literal instruction following——字面理解。
要它推广,必须明说:
请把这段文档里所有的「我们」改成「你」。 注意:是文档所有位置,不只是第一段,每一段都要改。
改动 3:reasoning effort 必须显式设置
GPT-5.2 比之前更严格遵守 effort 参数。OpenAI 推荐的对应关系:
| 老模型 | GPT-5.2 推荐 effort |
|---|---|
| GPT-4o / 4.1 迁移 | none(不开推理) |
| GPT-5 minimal | none |
| GPT-5.1 既有设置 | 直接保留 |
| 编程 / agentic 任务 | xhigh(新增等级) |
| 一般智力任务 | high |
| 成本敏感任务 | medium |
| 短延迟任务 | low |
坑:5.2 在 low effort 下会”严格按要求做事”,不会主动想多。如果你给的任务复杂但只开了 low,就会出现”想得太浅”的情况。
补救方法:
- 升 effort 到 high 或 xhigh
- 或在 prompt 里加一句「This task involves multi-step reasoning. Think carefully before responding.」
5 个 GPT-5.2 friendly 的 prompt 模板
下面 5 个模板都是按照官方 best practices 改写的,可以直接复制。
模板 1:精准内容生成(⭐ 小白)
场景:要 GPT-5.2 写一段内容,需要严格控制长度、格式、风格
任务:[一句话说清要写什么]
目标读者:[谁看这个内容]
格式要求(严格遵守):
- 总长度:[精确字数,如「不超过 300 字」]
- 段落数:[X 段]
- 每段开头:[一个具体动词 / 一个数字 / 一个问句]
- 禁用:[列 2-3 个不要出现的词或句式]
风格:
- [具体描述,如「像 36 氪财经记者写的」]
- 不要客套话,不要总结
输入素材: [粘贴你的原始素材]
输出:直接给最终版本,不要解释你做了什么。
怎么改:方括号里的内容替换成你的。关键是给具体而非抽象的描述。
模板 2:复杂任务分步执行(⭐⭐ 进阶)
场景:让 GPT-5.2 做一个需要拆解的多步骤任务,又希望它别想得太浅
This is a multi-step task that requires careful reasoning. Please think through each step before responding.
任务背景: [1-2 句话说明上下文]
具体任务: [写明最终要交付什么]
请按以下步骤完成:
- [步骤 1,比如:先列出所有已知信息]
- [步骤 2,比如:分析每条信息的影响]
- [步骤 3,比如:找出 2-3 个候选方案]
- [步骤 4,比如:评估每个方案的利弊]
- [步骤 5,输出最终建议 + 理由]
输出格式:
- 步骤 1-4 用 H3 小标题分隔,每节 100 字内
- 步骤 5 用表格:方案 | 评分 | 关键理由
请不要跳步,每一步都要展示思考过程。
怎么改:步骤数和格式都可以根据任务复杂度调。这个模板的关键是显式列出步骤——5.2 在 medium / high effort 下会严格按你给的步骤走。
模板 3:模糊问题先澄清再回答(⭐⭐ 进阶)
场景:你自己也没想清楚问题,希望 AI 先帮你梳理而不是急着给答案
我有一个问题需要你帮忙。但是在回答之前,请先和我确认 3-5 个能让答案更精准的关键点。
我的初步问题: [模糊版本的问题]
我已经知道的: [列你已经掌握的信息,可以少]
我希望最终的输出: [一个文档 / 一个方案 / 一段代码 / 一个判断]
请按以下方式做:
- 列出 3-5 个澄清问题(不要列超过 5 个,挑最关键的)
- 每个问题给 2-3 个可能选项让我选,不要让我开放回答
- 等我回答完,你再给完整方案
不要直接猜,不要替我做决策。
怎么改:适合咨询、规划、产品决策类问题。5.2 默认就喜欢这种模式,强化一下效果更稳。
模板 4:长文档结构化提取(⭐⭐ 进阶)
场景:丢一份长报告 / 合同 / 论文,要 AI 提取关键信息
我会给你一份长文档(约 [字数] 字)。请按下面的 JSON schema 提取关键信息。
提取规则:
- 每个字段必须从原文找到出处,禁止编造
- 找不到的字段填 null,不要用「暂无」「未知」等占位
- 涉及数字必须保留原文单位
- 涉及日期必须保留原文格式
JSON schema: (大括号 + 字段名 + 字段值类型)
- 核心结论:string,1 句话不超过 30 字
- 关键数据:数组,每项含「指标 / 数值 / 出处段落」
- 风险点:数组,每项含「描述 / 严重程度(high|medium|low)」
- 建议:字符串数组
请按上述结构输出标准 JSON。
提取完后请扫描一遍原文,确认没漏掉任何符合 schema 的信息。
文档: [粘贴你的文档]
怎么改:schema 里的字段按你的实际需要改。关键是先给 schema 再给文档,5.2 会更严格地遵守结构。
模板 5:编程任务(⭐⭐⭐ 专家)
场景:让 GPT-5.2 写代码或改代码,需要它自主完成不要追问
You are a senior engineer. Complete the following coding task autonomously.
Task: [一句话说清要做什么]
Context:
- 语言/框架:[Python 3.11 / Next.js 14 / …]
- 现有代码结构:[简单描述,或粘贴关键文件]
- 约束:[性能 / 兼容 / 风格要求]
Acceptance criteria:
- [测试场景 1,给具体输入输出]
- [测试场景 2]
- [测试场景 3]
要求:
- 一次性给完整可运行代码,不要中途问我
- 边界情况要处理:[列 2-3 个]
- 关键逻辑加注释,但不要逐行注释
- 写完后用 3 句话总结你的实现思路
不要:
- 不要加我没要求的功能
- 不要做 UX 优化
- 不要扩展接口
怎么改:编程任务建议 effort 设到 xhigh。这个模板用到了 OpenAI 官方推荐的”scope discipline”——明确禁止 feature creep。
GPT-5.2 上 prompt 常见坑 + 解决方案
| 现象 | 原因 | 解决 |
|---|---|---|
| 输出比 5.1 短一半 | 5.2 默认精简 | 在 prompt 里写死字数或要求 |
| 该用工具时不用 | 5.2 减少了工具调用倾向 | 提高 effort 到 high 或 xhigh,或显式说明何时该用 |
| 复杂任务想得很浅 | effort 太低 | 升 effort,或加「think carefully before responding」 |
| 模糊问题被反问 | 5.2 倾向澄清 | 把问题写清楚,或允许它澄清 |
| 老 prompt 表现下降 | 字面理解更严格 | 把隐含意图全部写出来 |
实战案例:一个 5.1 老 prompt 怎么改
下面是一个用了一年多的产品文档 prompt,迁移到 5.2 出现了 3 个问题。
原 prompt(5.1 时代):
你是产品经理,帮我写一份新功能 PRD。
功能:自动归档历史聊天
请尽量完整,最好覆盖所有方面。
5.1 输出:3000 字 PRD,包含背景、目标、用户故事、流程图、技术约束、上线计划
5.2 输出:800 字简版,缺了流程图和上线计划
问题:5.2 把”尽量完整”理解成”覆盖核心字段就行”,不会脑补你要哪些章节。
升级后的 prompt(5.2 friendly):
你是一位有 8 年经验的资深产品经理。请帮我写一份新功能 PRD。
功能简介:自动归档历史聊天
PRD 必须包含以下章节(缺一不可):
- 背景与问题(300 字内)
- 目标用户与场景(200 字内)
- 核心用户故事(5 条,每条「作为 X,我想 Y,以便 Z」格式)
- 功能流程(步骤化描述 + Mermaid 流程图代码)
- 边界与异常处理(列 5-8 条)
- 技术约束(与现有系统的耦合点)
- 数据指标(如何判断功能成功)
- 上线计划(含灰度方案)
要求:
- 总长度 2500-3500 字
- 每章节用 H2 分隔
- 不要写「值得注意的是」「综上所述」之类的废话
- 写完后用 3 句话总结这份 PRD 的核心要点
改了什么:
- 把”尽量完整”换成”必须包含 8 个章节”
- 给了每章节的字数和格式
- 显式禁了套话
结果:5.2 给出 2900 字 PRD,8 个章节全有,质量比 5.1 还高。
进阶:搭配 ChatGPT vs API 使用差异
如果你是在 ChatGPT 网页 / App 里用 调 5.2,不需要管 reasoning effort,因为 OpenAI 已经替你调好了。但prompt 写法的升级建议全部适用——具体、字面、明确格式。
如果你是 开发者用 API 调 5.2,effort 参数必须显式设置:
- 简单 chatbot:
low - 知识工作助手:
medium或high - 代码 agent:
xhigh - 极难的推理任务:
max(但注意可能 overthink)
不知道 ChatGPT 在国内能不能用?看 ChatGPT 国内能用吗 这篇。
下一步:把这套思路用到其他模型
GPT-5.2 的这些原则其实对 Claude 4.7、Gemini 3 也适用——都是新一代「literal instruction following」模型。
你可以接着看:
- Claude 4.7 提示词官方指南 — 对比 Anthropic 是怎么做的
- Anthropic Prompt Library 中文版 — 62 个高频模板
- ChatGPT 提示词最佳实践 — OpenAI 自家的通用 7 条原则
- Prompt 是什么 — 完全没基础的话从这篇开始
记一个原则:模型越聪明,越值得你把话说清楚。GPT-5.2 不是变难用了,是它把”模糊”和”清晰”的差距放大了——好 prompt 收益更高,坏 prompt 翻车更明显。
常见问题
Q:GPT-5.2 比 5.1 贵吗?
A:同 effort 下 token 单价接近,但 5.2 默认输出更短,实际跑下来一般更省钱。除非你跑 xhigh 或 max,那 token 用量会显著上升。
Q:5.2 上 ChatGPT 网页版会自动用吗? A:Plus 和 Pro 用户已经默认升级。免费用户在某些场景也会用到。具体看 ChatGPT 免费版。
Q:原来用 4o 的 prompt 全部要改吗? A:不一定。简单任务(翻译、概括、问答)多数能用。但任何依赖”AI 自行推理 / 自行扩展”的 prompt都建议按本文升级。
Q:5.2 的中文表现怎么样? A:和 5.1 接近,没有明显倒退。但因为输出更精简,中文 prompt 同样要写清楚字数和格式要求。