GPT-5.1 提示词官方指南：1 篇全文翻译

GPT-5.1 是 OpenAI 在 GPT-5 之后推出的重要迭代版本，主要改进在「推理 token 消耗控制更准」和「agent 任务持续性更强」两个方向。OpenAI 官方放了一份完整的 prompting guide，但全英文 + 长 + 偏开发者，对中国用户门槛较高。

这篇就是把官方 GPT-5.1 prompting guide 翻译成保姆级中文版，告诉你：

GPT-5.1 跟 GPT-5 / GPT-4.1 比改了什么
新增的 none reasoning effort 怎么用
agent 场景的 5 个调教技巧
新工具 apply_patch 和 shell 怎么用
6 个可直接复制的 GPT-5.1 prompt 模板

读完你能直接把现有 prompt 升级成「GPT-5.1 友好」版本。

30 秒了解 GPT-5.1 跟 GPT-5 的差距

OpenAI 官方说 GPT-5.1 是「reasoning token 消耗校准更好」的升级版。具体差距：

维度	GPT-5	GPT-5.1
reasoning 控制	`minimal` 起步	新增 `none` 完全关闭推理
简单任务响应	有时还会推理	简单任务直接答
复杂任务	完整推理	完整推理 + 更长持续性
输出冗长度	默认中等	默认偏简洁（要长输出需明示）
agent 持续性	易中途停	持续到任务完成
coding 工具	旧 patch 方式	新原生 `apply_patch`

核心信号：GPT-5.1 默认更精简，要长输出必须明说。

从 GPT-4.1 / GPT-5 迁移到 GPT-5.1 的关键改动

OpenAI 给了两条迁移路径，分别针对老用户。

如果你从 GPT-4.1 迁移过来

GPT-5.1 + reasoning_effort: "none" 是 GPT-4.1 的最自然替代品。原因：

none 完全不消耗 reasoning token，延迟和 GPT-4.1 接近
同时支持 web search、file search 等托管工具（GPT-4.1 不支持）
function calling 性能比 GPT-5 minimal 显著更强

迁移建议：先把所有 GPT-4.1 调用切到 GPT-5.1 + none，跑一遍 eval 对比效果。

如果你从 GPT-5 迁移过来

需要做 3 个关键调整：

调整 1：明确强调「坚持完成」

GPT-5.1 默认偏「保守 + 简洁」，agent 任务可能中途收手。在 system prompt 里加：

📋 Prompt 模板

你是一个 autonomous senior pair-programmer 类型的 agent。

行为规则：

一旦用户给出方向，主动收集上下文、规划、实现、测试、修正
不要在每一步都等用户确认，除非遇到真正的不确定
持续直到任务在当前回合内完整解决（end-to-end）
任务未完成不要 yield 控制权

记住：你是一个 agent，不是聊天机器人。

这一段是官方原话翻译，加了它 agent 持续性立刻提升。

调整 2：明确指定输出长度和格式

GPT-5.1 不会自动「写得长一点」。要详细输出，必须明示：

📋 Prompt 模板

输出格式要求：

小改动（≤10 行代码）：2-5 句话，0-1 个短代码片段
中等改动（多函数 / 单文件）：≤6 个 bullet，1-2 个代码片段
大改动（多文件 / 重构）：按文件分段，避免 inline 大段代码

不要超出对应级别的长度上限。

OpenAI 官方在 cookbook 反复强调：GPT-5.1 对「具体长度指引」响应很好。

调整 3：迁移到新的 `apply_patch` 工具

如果你的 coding agent 用旧 patch 方式，迁移到新 apply_patch 后 patch 失败率下降 35%（官方实测数据）。详见下文「新工具」章节。

reasoning_effort 怎么选

GPT-5.1 的 reasoning_effort 有 4 个档位：

档位	推理 token	适合场景	大致延迟
`none`	完全不推理	简单 lookup、function call、客服 FAQ	最快
`minimal`	极少	信息整理、简单分类	快
`medium`	中等（默认）	大部分任务	中
`high`	大量	复杂推理、多步规划、数学 / 代码	慢

`none` 模式的特别之处

none 是 GPT-5.1 的新功能，相当于「关掉大脑只输出」。但 OpenAI 在 cookbook 里特别提醒：用 none 时，要在 prompt 里手动补「思考过程」：

📋 Prompt 模板

在每次调用 function 之前，请先详细规划（plan extensively）。
在每次 function 返回之后，请详细反思（reflect extensively）。
当你需要在多个候选方案中选择时，请先确认每个候选符合用户所有约束（最便宜的、品牌、规格等），然后引用 item-id 和价格做确认，再执行。

这段「手动思考替代」是用 none 模式的关键，否则模型可能直接乱选。

怎么选

网页搜索、文件查询、固定流程客服 → none
邮件起草、摘要、简单分类 → minimal
通用任务 → 用默认（medium）
数学证明、复杂代码、长任务规划 → high

GPT-5.1 的人格 / 语气控制

GPT-5.1 比 GPT-5 更适合做「有性格的客服 agent」。官方推荐写法：

📋 Prompt 模板

你是一位简洁、可信、效率优先的客服 agent。

人格特征：

用词经济（economy-minded with language），不浪费每一个字
通过「快速推进」来表达尊重，而不是过度礼貌
不要说「got it」「thank you」「sure」这类无意义客套
节奏要匹配用户的能量：用户着急时直答，用户从容时多解释

例：用户：「我订单怎么还没发？」 ❌ 「您好！非常感谢您的耐心等待，让我马上为您查询订单状态……」 ✅ 「订单号？」

用户：「我想了解一下你们的产品有什么特点」 ❌ 「订单号？」 ✅ 「我们主打三点：[列出]。最关心哪一个？」

核心：通过「推进效率」表达尊重，不通过「客套话」。

agent 持续运行的 5 个关键写法

GPT-5.1 长任务场景下的 5 个官方推荐做法。

写法 1：明确「不要中途 yield」

📋 Prompt 模板

记住：你是 agent。请在用户的请求完全解决之前，不要结束你的 turn、不要交还给用户。

未完成的任务，请继续。

简短但有效。

写法 2：用 update_plan 做进度同步

对中型 / 大型任务（多文件改动、多 endpoint 开发），让 agent 维护一个轻量级 plan：

📋 Prompt 模板

对于中等及以上任务，请在执行前先调用 update_plan 工具维护进度。

规则：

计划项 2-5 条，不要拆得过细
同时只能有 1 项处于 in_progress 状态
大约每 8 次 tool call 同步一次状态
所有项目完成或显式取消之前不要结束 turn

写法 3：定期发短「进度更新」

长任务 6 步以上时，加 progress update：

📋 Prompt 模板

执行长任务时，请按以下节奏发送 progress 短消息：

每几次有意义的 tool call 后发一条 1-2 句的更新
每 6 步执行或每 8 次 tool call 必须发一次
更新内容：具体「自上次更新以来做了什么」（不是「下一步要做什么」）
任务结束时发完整 recap，包含所有 checklist 项的最终状态

策略提示：先发 commentary 消息，再做分析 thinking，体感延迟会显著降低。

写法 4：定义 tool 调用规则

OpenAI 推荐在 system prompt 里给 tool 加「触发条件」：

📋 Prompt 模板

工具调用规则：

当用户提到「预订 / 订座 / 安排」时，必须调用 create_reservation。

正面例子：

「帮我订今晚 7 点的位」→ create_reservation
「明天中午能不能去吃饭」→ create_reservation

反面例子：

「你们餐厅好吗？」→ 不要 call，直接回答
「能推荐几个菜吗？」→ 不要 call，直接推荐

所有 reads 和 patches 操作请并行执行（parallelize whenever possible）。

写法 5：用 verbosity 参数 + prompt 双重控制

GPT-5.1 既支持 verbosity 参数，也接受 prompt 内的长度指令。OpenAI 推荐两者一起用：

📋 Prompt 模板

verbosity: low

请用最多 2 句话回复，纯文本 + markdown 格式。先说你做了什么（或发现了什么），上下文只在必要时补充。

新工具：apply_patch 和 shell

GPT-5.1 引入两个原生工具，coding agent 必须用。

apply_patch

不再需要自己写 patch 描述，直接：

📋 Prompt 模板

tools=[{“type”: “apply_patch”}]

模型返回结构化的 apply_patch_call，包含：

操作类型（create_file / update_file / delete_file）
diff 内容
文件路径

实测收益：patch 失败率比旧方式下降 35%（OpenAI 官方数据）。

shell

允许 agent 在受控环境里跑命令行：

📋 Prompt 模板

tools=[{“type”: “shell”}]

调用时指定：

timeout（毫秒）
最大输出长度
命令数组

返回完整 stdout/stderr 和 exit code。适合让 agent 跑测试、查日志、做编译。

Meta Prompting 用法（官方推荐）

GPT-5.1 官方文档明确推荐用 meta prompting 迭代优化系统 prompt。两步走：

第 1 步：诊断

📋 Prompt 模板

下面是我现在的 system prompt 和它产生的几个失败案例。

请按以下结构分析（先不要给修改方案，只做诊断）：

失败模式：每个 case 属于哪一类问题
相关 prompt 段落：哪些指令导致了问题
因果机制：为什么这条指令会导致这个失败

请用结构化输出（JSON 或 markdown 表格）。

current prompt： [粘贴]

failure cases： [粘贴 3-5 个]

第 2 步：修改

基于第 1 步的诊断，让 GPT-5.1 给出精准修改：

📋 Prompt 模板

基于刚才的诊断，请：

澄清矛盾的指令
删除冗余
把模糊的 tradeoff 显式化
给出 patch notes（每处改动的理由）+ 完整的修改后 prompt

OpenAI 实测：这种「先诊断后修改」比让 GPT-5.1 直接「重写 prompt」效果好得多。

6 个 GPT-5.1 可直接复制的 prompt 模板

模板 1：通用 agent 启动

📋 Prompt 模板

你是一个 autonomous agent，目标是 [目标描述]。

行为规则：

主动收集上下文、规划、执行、验证、修正
不要在每一步等用户确认
持续到任务在当前 turn 内完整解决
进度按以下节奏同步：每 6 步发一次 progress 短消息

工具使用：所有 reads 和 patches 操作并行执行。

可用工具：[列出可用 tools]

任务正文：[填入]

模板 2：低延迟 function calling（none 模式）

📋 Prompt 模板

reasoning_effort: none
你是一个 [角色] agent。
在每次 function call 之前，请详细规划当前步骤。
在每次 function 返回之后，请反思结果是否符合预期。
如果遇到多候选选择，先确认每个候选符合用户所有约束（如最便宜、品牌、规格），引用具体 ID 和数值确认后再执行。
可用工具：[列出]

模板 3：精简客服回复

📋 Prompt 模板

verbosity: low

你是一位简洁的客服 agent。

回复规则：

最多 2 句话
用 markdown
直接给答案，不要客套
节奏匹配用户：用户急→简短；用户从容→可多解释

例：用户：「订单怎么还没发」→「订单号？」用户：「想了解你们产品」→ 简短特点列举 + 反问意图

模板 4：coding agent（带 apply_patch）

📋 Prompt 模板

你是一个 senior pair-programmer。

任务：[描述要写 / 改的代码]

输出长度规则：

小改动（≤10 行）：2-5 句话 + 0-1 个 snippet
中改动（多函数）：≤6 个 bullet + 1-2 个 snippet
大改动（多文件）：按文件分段，不要 inline 大段代码

工具：apply_patch、shell

请：

先读相关代码（并行 read）
用 update_plan 列 2-5 个里程碑
逐项 apply_patch 实施
每完成一项标记 status
全部完成后发 recap

模板 5：长任务进度同步

📋 Prompt 模板

你是 agent，正在执行多步任务。

进度同步规则：

每几次 tool call 发 1-2 句更新
每 6 步执行或每 8 次 tool call 必须发一次
更新内容：「自上次更新以来完成了什么」（不是「接下来做什么」）
任务结束发完整 recap，包含所有 checklist 状态
先发 commentary 消息再做 thinking，降低体感延迟

任务：[描述]

模板 6：前端 / 设计系统遵守

📋 Prompt 模板

你是一位严格遵守设计系统的前端工程师。

铁律：

不要 hard-code 颜色（hex / hsl / oklch / rgb）
所有颜色必须来自 globals.css 的 variables（如 —background、—foreground、—primary）
引入新品牌色时，先在 :root 和 .dark 下添加 token
通过 Tailwind utilities 消费 token

任务：[填入]

谁需要看这份指南

人群	关注点
开发者	reasoning_effort 选择、apply_patch、shell
产品 PM	agent 持续性、进度同步、verbosity
客服 / 运营	人格控制、简洁回复模板
Prompt 工程师	meta prompting 两步法、迁移指引
普通 ChatGPT 用户	知道为什么 5.1 输出变短了 + 怎么让它变长

常见问题

Q1：GPT-5.1 网页版（ChatGPT）能选 reasoning_effort 吗？

API 层可以精细控制；网页版自动按场景选。如果你在 ChatGPT 里发现回复偏短，可以在 prompt 里加「请详细展开」「请输出 800 字以上」明示。

Q2：GPT-5.1 还会推荐用思维链 CoT吗？

会，但场景变了。high 模式下模型内部自带 CoT；用 none 模式时，你需要在 prompt 里手动写「先规划再行动」。

Q3：GPT-5.1 跟 Claude 4.7 比哪个更适合 agent 场景？

各有优势：GPT-5.1 的 none 模式 + 原生 apply_patch 在低延迟 + coding 上有优势；Claude 4.7 在 100 万 token 长上下文 + 中文写作上更强。看 Claude vs ChatGPT对比。

Q4：GPT-5.2 出来后这份指南还能用吗？

大部分仍适用，但 GPT-5.2 又有新调整，详见GPT-5.2 prompt 官方指南。

Q5：Meta Prompting 在 GPT-5.1 上效果好吗？

非常好。GPT-5.1 对「显式指令 + 结构化任务」响应灵敏，meta prompting 生成的标准化 prompt 在它身上效果尤其稳定。

下一步

学完 GPT-5.1 指南，建议你继续：

ChatGPT 提示词最佳实践 — 通用版的 OpenAI 官方 prompt 心法
Claude 4 提示词官方指南 — 横向对比另一家旗舰模型的 prompt 策略
Prompt 模板和变量怎么用 — 把上面 6 个模板系统化管理
Meta Prompting 是什么 — 让 GPT-5.1 自己帮你写 prompt

一句话总结：GPT-5.1 是更「听话」的 5.0。它不会自作主张帮你脑补，所以你要把指令写得更清晰、长度要求更明确、agent 持续性要显式强调。把这些调到位，5.1 的稳定性和成本效率都比 5.0 上一个台阶。

30 秒了解 GPT-5.1 跟 GPT-5 的差距

从 GPT-4.1 / GPT-5 迁移到 GPT-5.1 的关键改动

如果你从 GPT-4.1 迁移过来

如果你从 GPT-5 迁移过来

调整 1：明确强调「坚持完成」

调整 2：明确指定输出长度和格式

调整 3：迁移到新的 apply_patch 工具

reasoning_effort 怎么选

none 模式的特别之处

怎么选

GPT-5.1 的人格 / 语气控制

agent 持续运行的 5 个关键写法

写法 1：明确「不要中途 yield」

写法 2：用 update_plan 做进度同步

写法 3：定期发短「进度更新」

写法 4：定义 tool 调用规则

写法 5：用 verbosity 参数 + prompt 双重控制

新工具：apply_patch 和 shell

apply_patch

shell

Meta Prompting 用法（官方推荐）

第 1 步：诊断

第 2 步：修改

6 个 GPT-5.1 可直接复制的 prompt 模板

模板 1：通用 agent 启动

模板 2：低延迟 function calling（none 模式）

模板 3：精简客服回复

模板 4：coding agent（带 apply_patch）

模板 5：长任务进度同步

模板 6：前端 / 设计系统遵守

谁需要看这份指南

常见问题

Q1：GPT-5.1 网页版（ChatGPT）能选 reasoning_effort 吗？

Q2：GPT-5.1 还会推荐用 思维链 CoT吗？

Q3：GPT-5.1 跟 Claude 4.7 比哪个更适合 agent 场景？

Q4：GPT-5.2 出来后这份指南还能用吗？

Q5：Meta Prompting 在 GPT-5.1 上效果好吗？

下一步

调整 3：迁移到新的 `apply_patch` 工具

`none` 模式的特别之处

Q2：GPT-5.1 还会推荐用思维链 CoT吗？