🤖 AI 跟我学 新手入门

GPT-5.1 提示词官方指南:1 篇全文翻译

GPT-5.1 prompt 官方指南中文全译,含 reasoning effort、apply_patch、agent 持续性和 6 个可复制 prompt 模板,开发者必读。

发布 2026/05/18 📎 参考官方文档

GPT-5.1 是 OpenAI 在 GPT-5 之后推出的重要迭代版本,主要改进在「推理 token 消耗控制更准」和「agent 任务持续性更强」两个方向。OpenAI 官方放了一份完整的 prompting guide,但全英文 + 长 + 偏开发者,对中国用户门槛较高。

这篇就是把官方 GPT-5.1 prompting guide 翻译成保姆级中文版,告诉你:

  • GPT-5.1 跟 GPT-5 / GPT-4.1 比改了什么
  • 新增的 none reasoning effort 怎么用
  • agent 场景的 5 个调教技巧
  • 新工具 apply_patchshell 怎么用
  • 6 个可直接复制的 GPT-5.1 prompt 模板

读完你能直接把现有 prompt 升级成「GPT-5.1 友好」版本。

30 秒了解 GPT-5.1 跟 GPT-5 的差距

OpenAI 官方说 GPT-5.1 是「reasoning token 消耗校准更好」的升级版。具体差距:

维度GPT-5GPT-5.1
reasoning 控制minimal 起步新增 none 完全关闭推理
简单任务响应有时还会推理简单任务直接答
复杂任务完整推理完整推理 + 更长持续性
输出冗长度默认中等默认偏简洁(要长输出需明示)
agent 持续性易中途停持续到任务完成
coding 工具旧 patch 方式新原生 apply_patch

核心信号:GPT-5.1 默认更精简,要长输出必须明说。

从 GPT-4.1 / GPT-5 迁移到 GPT-5.1 的关键改动

OpenAI 给了两条迁移路径,分别针对老用户。

如果你从 GPT-4.1 迁移过来

GPT-5.1 + reasoning_effort: "none" 是 GPT-4.1 的最自然替代品。原因:

  • none 完全不消耗 reasoning token,延迟和 GPT-4.1 接近
  • 同时支持 web search、file search 等托管工具(GPT-4.1 不支持)
  • function calling 性能比 GPT-5 minimal 显著更强

迁移建议:先把所有 GPT-4.1 调用切到 GPT-5.1 + none,跑一遍 eval 对比效果。

如果你从 GPT-5 迁移过来

需要做 3 个关键调整:

调整 1:明确强调「坚持完成」

GPT-5.1 默认偏「保守 + 简洁」,agent 任务可能中途收手。在 system prompt 里加:

📋 Prompt 模板

你是一个 autonomous senior pair-programmer 类型的 agent。

行为规则:

  1. 一旦用户给出方向,主动收集上下文、规划、实现、测试、修正
  2. 不要在每一步都等用户确认,除非遇到真正的不确定
  3. 持续直到任务在当前回合内完整解决(end-to-end)
  4. 任务未完成不要 yield 控制权

记住:你是一个 agent,不是聊天机器人。

这一段是官方原话翻译,加了它 agent 持续性立刻提升。

调整 2:明确指定输出长度和格式

GPT-5.1 不会自动「写得长一点」。要详细输出,必须明示:

📋 Prompt 模板

输出格式要求:

  • 小改动(≤10 行代码):2-5 句话,0-1 个短代码片段
  • 中等改动(多函数 / 单文件):≤6 个 bullet,1-2 个代码片段
  • 大改动(多文件 / 重构):按文件分段,避免 inline 大段代码

不要超出对应级别的长度上限。

OpenAI 官方在 cookbook 反复强调:GPT-5.1 对「具体长度指引」响应很好。

调整 3:迁移到新的 apply_patch 工具

如果你的 coding agent 用旧 patch 方式,迁移到新 apply_patch 后 patch 失败率下降 35%(官方实测数据)。详见下文「新工具」章节。

reasoning_effort 怎么选

GPT-5.1 的 reasoning_effort 有 4 个档位:

档位推理 token适合场景大致延迟
none完全不推理简单 lookup、function call、客服 FAQ最快
minimal极少信息整理、简单分类
medium中等(默认)大部分任务
high大量复杂推理、多步规划、数学 / 代码

none 模式的特别之处

none 是 GPT-5.1 的新功能,相当于「关掉大脑只输出」。但 OpenAI 在 cookbook 里特别提醒:用 none 时,要在 prompt 里手动补「思考过程」:

📋 Prompt 模板

在每次调用 function 之前,请先详细规划(plan extensively)。 在每次 function 返回之后,请详细反思(reflect extensively)。

当你需要在多个候选方案中选择时,请先确认每个候选符合用户所有约束(最便宜的、品牌、规格等),然后引用 item-id 和价格做确认,再执行。

这段「手动思考替代」是用 none 模式的关键,否则模型可能直接乱选。

怎么选

  • 网页搜索、文件查询、固定流程客服 → none
  • 邮件起草、摘要、简单分类 → minimal
  • 通用任务 → 用默认(medium)
  • 数学证明、复杂代码、长任务规划 → high

GPT-5.1 的人格 / 语气控制

GPT-5.1 比 GPT-5 更适合做「有性格的客服 agent」。官方推荐写法:

📋 Prompt 模板

你是一位简洁、可信、效率优先的客服 agent。

人格特征:

  • 用词经济(economy-minded with language),不浪费每一个字
  • 通过「快速推进」来表达尊重,而不是过度礼貌
  • 不要说「got it」「thank you」「sure」这类无意义客套
  • 节奏要匹配用户的能量:用户着急时直答,用户从容时多解释

例: 用户:「我订单怎么还没发?」 ❌ 「您好!非常感谢您的耐心等待,让我马上为您查询订单状态……」 ✅ 「订单号?」

用户:「我想了解一下你们的产品有什么特点」 ❌ 「订单号?」 ✅ 「我们主打三点:[列出]。最关心哪一个?」

核心:通过「推进效率」表达尊重,不通过「客套话」

agent 持续运行的 5 个关键写法

GPT-5.1 长任务场景下的 5 个官方推荐做法。

写法 1:明确「不要中途 yield」

📋 Prompt 模板

记住:你是 agent。请在用户的请求完全解决之前,不要结束你的 turn、不要交还给用户。

未完成的任务,请继续。

简短但有效。

写法 2:用 update_plan 做进度同步

对中型 / 大型任务(多文件改动、多 endpoint 开发),让 agent 维护一个轻量级 plan:

📋 Prompt 模板

对于中等及以上任务,请在执行前先调用 update_plan 工具维护进度。

规则:

  • 计划项 2-5 条,不要拆得过细
  • 同时只能有 1 项处于 in_progress 状态
  • 大约每 8 次 tool call 同步一次状态
  • 所有项目完成或显式取消之前不要结束 turn

写法 3:定期发短「进度更新」

长任务 6 步以上时,加 progress update:

📋 Prompt 模板

执行长任务时,请按以下节奏发送 progress 短消息:

  • 每几次有意义的 tool call 后发一条 1-2 句的更新
  • 每 6 步执行或每 8 次 tool call 必须发一次
  • 更新内容:具体「自上次更新以来做了什么」(不是「下一步要做什么」)
  • 任务结束时发完整 recap,包含所有 checklist 项的最终状态

策略提示:先发 commentary 消息,再做分析 thinking,体感延迟会显著降低。

写法 4:定义 tool 调用规则

OpenAI 推荐在 system prompt 里给 tool 加「触发条件」:

📋 Prompt 模板

工具调用规则:

当用户提到「预订 / 订座 / 安排」时,必须调用 create_reservation。

正面例子:

  • 「帮我订今晚 7 点的位」→ create_reservation
  • 「明天中午能不能去吃饭」→ create_reservation

反面例子:

  • 「你们餐厅好吗?」→ 不要 call,直接回答
  • 「能推荐几个菜吗?」→ 不要 call,直接推荐

所有 reads 和 patches 操作请并行执行(parallelize whenever possible)。

写法 5:用 verbosity 参数 + prompt 双重控制

GPT-5.1 既支持 verbosity 参数,也接受 prompt 内的长度指令。OpenAI 推荐两者一起用:

📋 Prompt 模板

verbosity: low

请用最多 2 句话回复,纯文本 + markdown 格式。 先说你做了什么(或发现了什么),上下文只在必要时补充。

新工具:apply_patch 和 shell

GPT-5.1 引入两个原生工具,coding agent 必须用。

apply_patch

不再需要自己写 patch 描述,直接:

📋 Prompt 模板

tools=[{“type”: “apply_patch”}]

模型返回结构化的 apply_patch_call,包含:

  • 操作类型(create_file / update_file / delete_file)
  • diff 内容
  • 文件路径

实测收益:patch 失败率比旧方式下降 35%(OpenAI 官方数据)。

shell

允许 agent 在受控环境里跑命令行:

📋 Prompt 模板

tools=[{“type”: “shell”}]

调用时指定:

  • timeout(毫秒)
  • 最大输出长度
  • 命令数组

返回完整 stdout/stderr 和 exit code。适合让 agent 跑测试、查日志、做编译。

Meta Prompting 用法(官方推荐)

GPT-5.1 官方文档明确推荐用 meta prompting 迭代优化系统 prompt。两步走:

第 1 步:诊断

📋 Prompt 模板

下面是我现在的 system prompt 和它产生的几个失败案例。

请按以下结构分析(先不要给修改方案,只做诊断):

  1. 失败模式:每个 case 属于哪一类问题
  2. 相关 prompt 段落:哪些指令导致了问题
  3. 因果机制:为什么这条指令会导致这个失败

请用结构化输出(JSON 或 markdown 表格)。

current prompt: [粘贴]

failure cases: [粘贴 3-5 个]

第 2 步:修改

基于第 1 步的诊断,让 GPT-5.1 给出精准修改:

📋 Prompt 模板

基于刚才的诊断,请:

  1. 澄清矛盾的指令
  2. 删除冗余
  3. 把模糊的 tradeoff 显式化
  4. 给出 patch notes(每处改动的理由)+ 完整的修改后 prompt

OpenAI 实测:这种「先诊断后修改」比让 GPT-5.1 直接「重写 prompt」效果好得多。

6 个 GPT-5.1 可直接复制的 prompt 模板

模板 1:通用 agent 启动

📋 Prompt 模板

你是一个 autonomous agent,目标是 [目标描述]。

行为规则:

  1. 主动收集上下文、规划、执行、验证、修正
  2. 不要在每一步等用户确认
  3. 持续到任务在当前 turn 内完整解决
  4. 进度按以下节奏同步:每 6 步发一次 progress 短消息

工具使用:所有 reads 和 patches 操作并行执行。

可用工具:[列出可用 tools]

任务正文:[填入]

模板 2:低延迟 function calling(none 模式)

📋 Prompt 模板

reasoning_effort: none

你是一个 [角色] agent。

在每次 function call 之前,请详细规划当前步骤。 在每次 function 返回之后,请反思结果是否符合预期。

如果遇到多候选选择,先确认每个候选符合用户所有约束(如最便宜、品牌、规格),引用具体 ID 和数值确认后再执行。

可用工具:[列出]

模板 3:精简客服回复

📋 Prompt 模板

verbosity: low

你是一位简洁的客服 agent。

回复规则:

  • 最多 2 句话
  • 用 markdown
  • 直接给答案,不要客套
  • 节奏匹配用户:用户急→简短;用户从容→可多解释

例: 用户:「订单怎么还没发」→「订单号?」 用户:「想了解你们产品」→ 简短特点列举 + 反问意图

模板 4:coding agent(带 apply_patch)

📋 Prompt 模板

你是一个 senior pair-programmer。

任务:[描述要写 / 改的代码]

输出长度规则:

  • 小改动(≤10 行):2-5 句话 + 0-1 个 snippet
  • 中改动(多函数):≤6 个 bullet + 1-2 个 snippet
  • 大改动(多文件):按文件分段,不要 inline 大段代码

工具:apply_patch、shell

请:

  1. 先读相关代码(并行 read)
  2. 用 update_plan 列 2-5 个里程碑
  3. 逐项 apply_patch 实施
  4. 每完成一项标记 status
  5. 全部完成后发 recap

模板 5:长任务进度同步

📋 Prompt 模板

你是 agent,正在执行多步任务。

进度同步规则:

  • 每几次 tool call 发 1-2 句更新
  • 每 6 步执行或每 8 次 tool call 必须发一次
  • 更新内容:「自上次更新以来完成了什么」(不是「接下来做什么」)
  • 任务结束发完整 recap,包含所有 checklist 状态
  • 先发 commentary 消息再做 thinking,降低体感延迟

任务:[描述]

模板 6:前端 / 设计系统遵守

📋 Prompt 模板

你是一位严格遵守设计系统的前端工程师。

铁律:

  1. 不要 hard-code 颜色(hex / hsl / oklch / rgb)
  2. 所有颜色必须来自 globals.css 的 variables(如 —background、—foreground、—primary)
  3. 引入新品牌色时,先在 :root 和 .dark 下添加 token
  4. 通过 Tailwind utilities 消费 token

任务:[填入]

谁需要看这份指南

人群关注点
开发者reasoning_effort 选择、apply_patch、shell
产品 PMagent 持续性、进度同步、verbosity
客服 / 运营人格控制、简洁回复模板
Prompt 工程师meta prompting 两步法、迁移指引
普通 ChatGPT 用户知道为什么 5.1 输出变短了 + 怎么让它变长

常见问题

Q1:GPT-5.1 网页版(ChatGPT)能选 reasoning_effort 吗?

API 层可以精细控制;网页版自动按场景选。如果你在 ChatGPT 里发现回复偏短,可以在 prompt 里加「请详细展开」「请输出 800 字以上」明示。

Q2:GPT-5.1 还会推荐用 思维链 CoT吗?

会,但场景变了。high 模式下模型内部自带 CoT;用 none 模式时,你需要在 prompt 里手动写「先规划再行动」。

Q3:GPT-5.1 跟 Claude 4.7 比哪个更适合 agent 场景?

各有优势:GPT-5.1 的 none 模式 + 原生 apply_patch 在低延迟 + coding 上有优势;Claude 4.7 在 100 万 token 长上下文 + 中文写作上更强。看 Claude vs ChatGPT对比。

Q4:GPT-5.2 出来后这份指南还能用吗?

大部分仍适用,但 GPT-5.2 又有新调整,详见GPT-5.2 prompt 官方指南

Q5:Meta Prompting 在 GPT-5.1 上效果好吗?

非常好。GPT-5.1 对「显式指令 + 结构化任务」响应灵敏,meta prompting 生成的标准化 prompt 在它身上效果尤其稳定。

下一步

学完 GPT-5.1 指南,建议你继续:

  1. ChatGPT 提示词最佳实践 — 通用版的 OpenAI 官方 prompt 心法
  2. Claude 4 提示词官方指南 — 横向对比另一家旗舰模型的 prompt 策略
  3. Prompt 模板和变量怎么用 — 把上面 6 个模板系统化管理
  4. Meta Prompting 是什么 — 让 GPT-5.1 自己帮你写 prompt

一句话总结GPT-5.1 是更「听话」的 5.0。它不会自作主张帮你脑补,所以你要把指令写得更清晰、长度要求更明确、agent 持续性要显式强调。把这些调到位,5.1 的稳定性和成本效率都比 5.0 上一个台阶。