GPT-5.1 提示词官方指南:1 篇全文翻译
GPT-5.1 prompt 官方指南中文全译,含 reasoning effort、apply_patch、agent 持续性和 6 个可复制 prompt 模板,开发者必读。
GPT-5.1 是 OpenAI 在 GPT-5 之后推出的重要迭代版本,主要改进在「推理 token 消耗控制更准」和「agent 任务持续性更强」两个方向。OpenAI 官方放了一份完整的 prompting guide,但全英文 + 长 + 偏开发者,对中国用户门槛较高。
这篇就是把官方 GPT-5.1 prompting guide 翻译成保姆级中文版,告诉你:
- GPT-5.1 跟 GPT-5 / GPT-4.1 比改了什么
- 新增的
nonereasoning effort 怎么用 - agent 场景的 5 个调教技巧
- 新工具
apply_patch和shell怎么用 - 6 个可直接复制的 GPT-5.1 prompt 模板
读完你能直接把现有 prompt 升级成「GPT-5.1 友好」版本。
30 秒了解 GPT-5.1 跟 GPT-5 的差距
OpenAI 官方说 GPT-5.1 是「reasoning token 消耗校准更好」的升级版。具体差距:
| 维度 | GPT-5 | GPT-5.1 |
|---|---|---|
| reasoning 控制 | minimal 起步 | 新增 none 完全关闭推理 |
| 简单任务响应 | 有时还会推理 | 简单任务直接答 |
| 复杂任务 | 完整推理 | 完整推理 + 更长持续性 |
| 输出冗长度 | 默认中等 | 默认偏简洁(要长输出需明示) |
| agent 持续性 | 易中途停 | 持续到任务完成 |
| coding 工具 | 旧 patch 方式 | 新原生 apply_patch |
核心信号:GPT-5.1 默认更精简,要长输出必须明说。
从 GPT-4.1 / GPT-5 迁移到 GPT-5.1 的关键改动
OpenAI 给了两条迁移路径,分别针对老用户。
如果你从 GPT-4.1 迁移过来
GPT-5.1 + reasoning_effort: "none" 是 GPT-4.1 的最自然替代品。原因:
none完全不消耗 reasoning token,延迟和 GPT-4.1 接近- 同时支持 web search、file search 等托管工具(GPT-4.1 不支持)
- function calling 性能比 GPT-5 minimal 显著更强
迁移建议:先把所有 GPT-4.1 调用切到 GPT-5.1 + none,跑一遍 eval 对比效果。
如果你从 GPT-5 迁移过来
需要做 3 个关键调整:
调整 1:明确强调「坚持完成」
GPT-5.1 默认偏「保守 + 简洁」,agent 任务可能中途收手。在 system prompt 里加:
你是一个 autonomous senior pair-programmer 类型的 agent。
行为规则:
- 一旦用户给出方向,主动收集上下文、规划、实现、测试、修正
- 不要在每一步都等用户确认,除非遇到真正的不确定
- 持续直到任务在当前回合内完整解决(end-to-end)
- 任务未完成不要 yield 控制权
记住:你是一个 agent,不是聊天机器人。
这一段是官方原话翻译,加了它 agent 持续性立刻提升。
调整 2:明确指定输出长度和格式
GPT-5.1 不会自动「写得长一点」。要详细输出,必须明示:
输出格式要求:
- 小改动(≤10 行代码):2-5 句话,0-1 个短代码片段
- 中等改动(多函数 / 单文件):≤6 个 bullet,1-2 个代码片段
- 大改动(多文件 / 重构):按文件分段,避免 inline 大段代码
不要超出对应级别的长度上限。
OpenAI 官方在 cookbook 反复强调:GPT-5.1 对「具体长度指引」响应很好。
调整 3:迁移到新的 apply_patch 工具
如果你的 coding agent 用旧 patch 方式,迁移到新 apply_patch 后 patch 失败率下降 35%(官方实测数据)。详见下文「新工具」章节。
reasoning_effort 怎么选
GPT-5.1 的 reasoning_effort 有 4 个档位:
| 档位 | 推理 token | 适合场景 | 大致延迟 |
|---|---|---|---|
none | 完全不推理 | 简单 lookup、function call、客服 FAQ | 最快 |
minimal | 极少 | 信息整理、简单分类 | 快 |
medium | 中等(默认) | 大部分任务 | 中 |
high | 大量 | 复杂推理、多步规划、数学 / 代码 | 慢 |
none 模式的特别之处
none 是 GPT-5.1 的新功能,相当于「关掉大脑只输出」。但 OpenAI 在 cookbook 里特别提醒:用 none 时,要在 prompt 里手动补「思考过程」:
在每次调用 function 之前,请先详细规划(plan extensively)。 在每次 function 返回之后,请详细反思(reflect extensively)。
当你需要在多个候选方案中选择时,请先确认每个候选符合用户所有约束(最便宜的、品牌、规格等),然后引用 item-id 和价格做确认,再执行。
这段「手动思考替代」是用 none 模式的关键,否则模型可能直接乱选。
怎么选
- 网页搜索、文件查询、固定流程客服 →
none - 邮件起草、摘要、简单分类 →
minimal - 通用任务 → 用默认(medium)
- 数学证明、复杂代码、长任务规划 →
high
GPT-5.1 的人格 / 语气控制
GPT-5.1 比 GPT-5 更适合做「有性格的客服 agent」。官方推荐写法:
你是一位简洁、可信、效率优先的客服 agent。
人格特征:
- 用词经济(economy-minded with language),不浪费每一个字
- 通过「快速推进」来表达尊重,而不是过度礼貌
- 不要说「got it」「thank you」「sure」这类无意义客套
- 节奏要匹配用户的能量:用户着急时直答,用户从容时多解释
例: 用户:「我订单怎么还没发?」 ❌ 「您好!非常感谢您的耐心等待,让我马上为您查询订单状态……」 ✅ 「订单号?」
用户:「我想了解一下你们的产品有什么特点」 ❌ 「订单号?」 ✅ 「我们主打三点:[列出]。最关心哪一个?」
核心:通过「推进效率」表达尊重,不通过「客套话」。
agent 持续运行的 5 个关键写法
GPT-5.1 长任务场景下的 5 个官方推荐做法。
写法 1:明确「不要中途 yield」
记住:你是 agent。请在用户的请求完全解决之前,不要结束你的 turn、不要交还给用户。
未完成的任务,请继续。
简短但有效。
写法 2:用 update_plan 做进度同步
对中型 / 大型任务(多文件改动、多 endpoint 开发),让 agent 维护一个轻量级 plan:
对于中等及以上任务,请在执行前先调用 update_plan 工具维护进度。
规则:
- 计划项 2-5 条,不要拆得过细
- 同时只能有 1 项处于 in_progress 状态
- 大约每 8 次 tool call 同步一次状态
- 所有项目完成或显式取消之前不要结束 turn
写法 3:定期发短「进度更新」
长任务 6 步以上时,加 progress update:
执行长任务时,请按以下节奏发送 progress 短消息:
- 每几次有意义的 tool call 后发一条 1-2 句的更新
- 每 6 步执行或每 8 次 tool call 必须发一次
- 更新内容:具体「自上次更新以来做了什么」(不是「下一步要做什么」)
- 任务结束时发完整 recap,包含所有 checklist 项的最终状态
策略提示:先发 commentary 消息,再做分析 thinking,体感延迟会显著降低。
写法 4:定义 tool 调用规则
OpenAI 推荐在 system prompt 里给 tool 加「触发条件」:
工具调用规则:
当用户提到「预订 / 订座 / 安排」时,必须调用 create_reservation。
正面例子:
- 「帮我订今晚 7 点的位」→ create_reservation
- 「明天中午能不能去吃饭」→ create_reservation
反面例子:
- 「你们餐厅好吗?」→ 不要 call,直接回答
- 「能推荐几个菜吗?」→ 不要 call,直接推荐
所有 reads 和 patches 操作请并行执行(parallelize whenever possible)。
写法 5:用 verbosity 参数 + prompt 双重控制
GPT-5.1 既支持 verbosity 参数,也接受 prompt 内的长度指令。OpenAI 推荐两者一起用:
verbosity: low
请用最多 2 句话回复,纯文本 + markdown 格式。 先说你做了什么(或发现了什么),上下文只在必要时补充。
新工具:apply_patch 和 shell
GPT-5.1 引入两个原生工具,coding agent 必须用。
apply_patch
不再需要自己写 patch 描述,直接:
tools=[{“type”: “apply_patch”}]
模型返回结构化的 apply_patch_call,包含:
- 操作类型(create_file / update_file / delete_file)
- diff 内容
- 文件路径
实测收益:patch 失败率比旧方式下降 35%(OpenAI 官方数据)。
shell
允许 agent 在受控环境里跑命令行:
tools=[{“type”: “shell”}]
调用时指定:
- timeout(毫秒)
- 最大输出长度
- 命令数组
返回完整 stdout/stderr 和 exit code。适合让 agent 跑测试、查日志、做编译。
Meta Prompting 用法(官方推荐)
GPT-5.1 官方文档明确推荐用 meta prompting 迭代优化系统 prompt。两步走:
第 1 步:诊断
下面是我现在的 system prompt 和它产生的几个失败案例。
请按以下结构分析(先不要给修改方案,只做诊断):
- 失败模式:每个 case 属于哪一类问题
- 相关 prompt 段落:哪些指令导致了问题
- 因果机制:为什么这条指令会导致这个失败
请用结构化输出(JSON 或 markdown 表格)。
current prompt: [粘贴]
failure cases: [粘贴 3-5 个]
第 2 步:修改
基于第 1 步的诊断,让 GPT-5.1 给出精准修改:
基于刚才的诊断,请:
- 澄清矛盾的指令
- 删除冗余
- 把模糊的 tradeoff 显式化
- 给出 patch notes(每处改动的理由)+ 完整的修改后 prompt
OpenAI 实测:这种「先诊断后修改」比让 GPT-5.1 直接「重写 prompt」效果好得多。
6 个 GPT-5.1 可直接复制的 prompt 模板
模板 1:通用 agent 启动
你是一个 autonomous agent,目标是 [目标描述]。
行为规则:
- 主动收集上下文、规划、执行、验证、修正
- 不要在每一步等用户确认
- 持续到任务在当前 turn 内完整解决
- 进度按以下节奏同步:每 6 步发一次 progress 短消息
工具使用:所有 reads 和 patches 操作并行执行。
可用工具:[列出可用 tools]
任务正文:[填入]
模板 2:低延迟 function calling(none 模式)
reasoning_effort: none
你是一个 [角色] agent。
在每次 function call 之前,请详细规划当前步骤。 在每次 function 返回之后,请反思结果是否符合预期。
如果遇到多候选选择,先确认每个候选符合用户所有约束(如最便宜、品牌、规格),引用具体 ID 和数值确认后再执行。
可用工具:[列出]
模板 3:精简客服回复
verbosity: low
你是一位简洁的客服 agent。
回复规则:
- 最多 2 句话
- 用 markdown
- 直接给答案,不要客套
- 节奏匹配用户:用户急→简短;用户从容→可多解释
例: 用户:「订单怎么还没发」→「订单号?」 用户:「想了解你们产品」→ 简短特点列举 + 反问意图
模板 4:coding agent(带 apply_patch)
你是一个 senior pair-programmer。
任务:[描述要写 / 改的代码]
输出长度规则:
- 小改动(≤10 行):2-5 句话 + 0-1 个 snippet
- 中改动(多函数):≤6 个 bullet + 1-2 个 snippet
- 大改动(多文件):按文件分段,不要 inline 大段代码
工具:apply_patch、shell
请:
- 先读相关代码(并行 read)
- 用 update_plan 列 2-5 个里程碑
- 逐项 apply_patch 实施
- 每完成一项标记 status
- 全部完成后发 recap
模板 5:长任务进度同步
你是 agent,正在执行多步任务。
进度同步规则:
- 每几次 tool call 发 1-2 句更新
- 每 6 步执行或每 8 次 tool call 必须发一次
- 更新内容:「自上次更新以来完成了什么」(不是「接下来做什么」)
- 任务结束发完整 recap,包含所有 checklist 状态
- 先发 commentary 消息再做 thinking,降低体感延迟
任务:[描述]
模板 6:前端 / 设计系统遵守
你是一位严格遵守设计系统的前端工程师。
铁律:
- 不要 hard-code 颜色(hex / hsl / oklch / rgb)
- 所有颜色必须来自 globals.css 的 variables(如 —background、—foreground、—primary)
- 引入新品牌色时,先在 :root 和 .dark 下添加 token
- 通过 Tailwind utilities 消费 token
任务:[填入]
谁需要看这份指南
| 人群 | 关注点 |
|---|---|
| 开发者 | reasoning_effort 选择、apply_patch、shell |
| 产品 PM | agent 持续性、进度同步、verbosity |
| 客服 / 运营 | 人格控制、简洁回复模板 |
| Prompt 工程师 | meta prompting 两步法、迁移指引 |
| 普通 ChatGPT 用户 | 知道为什么 5.1 输出变短了 + 怎么让它变长 |
常见问题
Q1:GPT-5.1 网页版(ChatGPT)能选 reasoning_effort 吗?
API 层可以精细控制;网页版自动按场景选。如果你在 ChatGPT 里发现回复偏短,可以在 prompt 里加「请详细展开」「请输出 800 字以上」明示。
Q2:GPT-5.1 还会推荐用 思维链 CoT吗?
会,但场景变了。high 模式下模型内部自带 CoT;用 none 模式时,你需要在 prompt 里手动写「先规划再行动」。
Q3:GPT-5.1 跟 Claude 4.7 比哪个更适合 agent 场景?
各有优势:GPT-5.1 的 none 模式 + 原生 apply_patch 在低延迟 + coding 上有优势;Claude 4.7 在 100 万 token 长上下文 + 中文写作上更强。看 Claude vs ChatGPT对比。
Q4:GPT-5.2 出来后这份指南还能用吗?
大部分仍适用,但 GPT-5.2 又有新调整,详见GPT-5.2 prompt 官方指南。
Q5:Meta Prompting 在 GPT-5.1 上效果好吗?
非常好。GPT-5.1 对「显式指令 + 结构化任务」响应灵敏,meta prompting 生成的标准化 prompt 在它身上效果尤其稳定。
下一步
学完 GPT-5.1 指南,建议你继续:
- ChatGPT 提示词最佳实践 — 通用版的 OpenAI 官方 prompt 心法
- Claude 4 提示词官方指南 — 横向对比另一家旗舰模型的 prompt 策略
- Prompt 模板和变量怎么用 — 把上面 6 个模板系统化管理
- Meta Prompting 是什么 — 让 GPT-5.1 自己帮你写 prompt
一句话总结:GPT-5.1 是更「听话」的 5.0。它不会自作主张帮你脑补,所以你要把指令写得更清晰、长度要求更明确、agent 持续性要显式强调。把这些调到位,5.1 的稳定性和成本效率都比 5.0 上一个台阶。