Claude 4 提示词官方指南:高级技巧拆解
Claude 4 提示词最全官方指南中文版,含 XML 标签结构化、effort 调节、subagent 控制、长上下文 quote 法等 10 个 Anthropic 推荐技巧 + 5 个可复制模板
写 Claude 4 提示词,最容易踩的坑就是「把 ChatGPT 那套照搬过来」——结果输出又长又啰嗦,或者反而想得太浅。Claude 4.7 跟 GPT 系列的脾气真不一样,Anthropic 官方在 prompting best practices 里专门讲了一堆 4.x 系列才有的调教技巧。
这篇把官方那份英文文档翻成中文版的人话,重点说:
- Claude 4.7 跟 4.6 比改了什么
- 为什么所有人都建议给 Claude 用 XML 标签
- effort 参数到底怎么调最划算
- 长文档怎么喂才不丢信息
- 5 个可以直接抄走的高质量 prompt 模板
读完你能写出”Claude friendly”的高质量提示词,输出质量肉眼可见提升。
30 秒看懂 Claude 4 系列的 5 个核心脾气
Anthropic 官方文档把 Claude 4.7、4.6、Sonnet 4.6 和 Haiku 4.5 放在一起讲,因为这一代模型有共同的行为特征:
| 行为 | 旧 Claude 3.x | Claude 4.x |
|---|---|---|
| 默认啰嗦程度 | 比较长 | 根据任务难度自动调,简单问题更短 |
| 指令理解 | 会”贴心地”扩展 | 严格按字面,4.7 尤其明显 |
| 工具调用倾向 | 频繁 | 4.7 倾向先推理,少调工具 |
| 默认 emoji 和情感色彩 | 较温暖 | 4.7 更直接,emoji 少了 |
| 设计审美 | 通用 | 4.7 有默认审美偏好(serif 字体 + 米色背景) |
简单说:Claude 4.7 是一个更”硬核”的资深员工。它不会自作主张,但你给的指令越具体,它发挥得越好。
如果你完全没接触过 Claude,建议先看 Claude 是什么 和 Claude 完整入门指南 再回来看这篇。
Anthropic 官方推荐的 5 大通用原则
原则 1:把 Claude 当”聪明但刚入职的新人”
官方的”黄金法则”:把你的 prompt 拿给一个没有上下文的同事看。如果他看了会困惑,Claude 也会困惑。
差的写法:
帮我做一个 dashboard
好的写法:
帮我做一个销售数据 dashboard,包含:
- 顶部:今日 / 本周 / 本月 GMV 卡片,含同比环比
- 中部:销售趋势折线图,过去 30 天日维度
- 底部:Top 10 商品表格
风格:紧凑、信息密度高,参考 Linear 的设计
原则 2:给原因,不只给指令
Claude 对”为什么”特别敏感。同样的限制,加上原因效果更好。
差:
永远不要用省略号
好:
你的回答会被语音合成引擎朗读,所以永远不要用省略号——TTS 不知道怎么发音。
原则 3:用示例(few-shot)
Anthropic 官方推荐 3-5 个示例效果最好。示例要:
- 相关:贴近你的真实场景
- 多样:覆盖边界情况
- 结构化:用
<example>标签包起来
原则 4:用 XML 标签做结构
这是 Claude 跟 GPT 的最大区别——Claude 对 XML 标签的识别能力是顶级的。复杂 prompt 里把不同类型的内容(指令、上下文、示例、输入)用不同标签包起来,准确率立刻提升。
常用标签:
<instructions>包指令<context>包背景<example>单个示例,<examples>多个示例的外层<document>包长文档,可嵌套<source>标注来源
原则 5:给角色(system prompt)
哪怕只给一句:
You are a senior Python engineer specializing in data pipelines.
输出质量都会有明显提升。详细看 system prompt 是什么。
Claude 4.7 独家:effort 参数怎么调
Claude 4.7 引入了 5 级 effort 参数,比 GPT 系列粒度更细:
| 级别 | 适用场景 | 注意 |
|---|---|---|
max | 极难推理任务 | 可能 overthink,token 飙升 |
xhigh(4.7 新增) | 编程、agentic 任务 | 官方最推荐的编程档位 |
high | 大多数智力敏感任务的最低档 | 通用首选 |
medium | 成本敏感、可牺牲一些智力 | |
low | 短任务、低延迟 | 复杂任务会”想得浅” |
两个关键提醒:
- 4.7 比 4.6 更严格遵守 effort。设了
low它真的就少想,不会偷偷加戏 max和xhigh要给大的 max_tokens,官方建议 64k 起步
如果你看到 Claude 4.7 在复杂问题上推理浅,第一反应不是改 prompt,是升 effort。
长上下文(20k+ token)的 3 个铁律
官方专门提了,长文档场景下这 3 件事能让回答质量提升 30%:
铁律 1:长内容放在 prompt 最前面
把大段文档放在最上面,查询和指令放在最后面。这点和 GPT 完全相反(GPT 喜欢指令在前)。
铁律 2:多个文档用 XML 嵌套
<documents> <document index=“1”> <source>annual_report_2023.pdf</source> <document_content> [文档 1 内容] </document_content> </document> <document index=“2”> <source>competitor_analysis_q2.xlsx</source> <document_content> [文档 2 内容] </document_content> </document> </documents>
分析年报和竞品分析,找出 Q3 战略重点。
铁律 3:让 Claude 先 quote 再回答
长文档任务前面加一句:
回答前,请先从文档中提取相关原文片段(quote),然后再基于 quote 做回答。
这招让 Claude 强制聚焦相关信息,避免被无关内容干扰。
5 个可以直接抄的 Claude 4 高质量 prompt 模板
模板 1:通用任务 - XML 结构版(⭐ 小白)
场景:任何写作 / 分析 / 决策类任务的通用结构
<role> 你是一位 [职位 + 年限 + 专业领域]。 </role>
<context> [背景信息 1-3 句话] </context>
<task> [一句话说清要做什么] </task>
<requirements>
- 长度:[精确字数]
- 格式:[markdown / JSON / 纯文本 / …]
- 风格:[具体描述,不要用”专业""高质量”这种空词]
- 禁用:[列 2-3 个不要的] </requirements>
<input> [你的素材 / 数据 / 文档] </input>
请直接输出最终结果,不要解释你做了什么。
怎么改:方括号内容替换。这个结构对 Claude 4 的提升最大,比纯文本 prompt 准确率高 20-30%。
模板 2:长文档分析 - quote 法(⭐⭐ 进阶)
场景:给 Claude 一份长报告、合同、论文,要它做精准分析
<documents> <document index=“1”> <source>[文件名]</source> <document_content> [粘贴你的文档] </document_content> </document> </documents>
<instructions> 你的任务是分析上面这份文档,按以下流程做:
- 先从原文中 quote 出与下面问题相关的所有段落(每段不超过 100 字,至少 quote 3 段)
- 基于 quote 出来的内容,回答下面的问题
- 每个论点都要标注 quote 出处(用 [Q1] [Q2] 这种引用)
问题:
- [问题 1]
- [问题 2]
- [问题 3]
输出格式:
一、相关原文摘录
[Q1] ”…” (第 X 页 / 第 X 段) [Q2] ”…” [Q3] ”…”
二、回答
- [问题 1 答案,含 quote 引用]
- [问题 2 答案]
- [问题 3 答案] </instructions>
怎么改:问题数量随意。quote 法是 Anthropic 官方明确推荐,几乎是长文档任务必备。
模板 3:few-shot 风格学习(⭐⭐ 进阶)
场景:要 Claude 学一种特定的写作风格、格式或思路
<task> 按下面的示例风格,给我生成 5 个 [对象]。 </task>
<examples> <example index=“1”> [完整示例 1,包含输入和输出] </example>
<example index=“2”> [完整示例 2] </example>
<example index=“3”> [完整示例 3] </example> </examples>
<input> [新输入,让 Claude 按示例风格输出] </input>
要求:
- 严格模仿示例的句式、节奏、用词
- 不要解释你模仿了什么
- 直接输出 5 个新版本
怎么改:示例数量 3-5 个最佳,少于 3 个 Claude 抓不到规律,多于 5 个边际收益递减。
模板 4:编程任务 - 边界明确版(⭐⭐⭐ 专家)
场景:让 Claude 4.7 写代码,要它自主完成不要反复问
<role> You are a senior [语言] engineer. Complete this task autonomously. </role>
<task> [一句话说清功能] </task>
<context>
- 技术栈:[具体版本]
- 现有代码风格:[OOP / 函数式 / mixin / …]
- 关键依赖:[列 2-3 个] </context>
<acceptance_criteria>
- [测试场景 1,给输入输出]
- [测试场景 2]
- [测试场景 3]
- 边界情况:[列 3-5 个,比如”空输入”、“网络断”等] </acceptance_criteria>
<constraints>
- 不要加我没要求的功能
- 不要做 UX 美化
- 关键逻辑加注释,普通的不用
- 错误处理用 [try-catch / Result type / …] </constraints>
请:
- 先用 3 句话描述你的实现思路
- 再给出完整可运行代码
- 最后列出你做过的关键设计决策(2-3 条)
怎么改:编程任务建议 effort 设到 xhigh。如果你用的是 Claude Code,可以省略 role 标签直接进入 task。看 Claude Code 是什么 了解开发场景的最佳实践。
模板 5:让 Claude 自己问澄清问题(⭐⭐ 进阶)
场景:你的需求模糊,希望 Claude 帮你梳理再回答
<task> 我有一个需要你帮我做的任务,但我自己也没完全想清楚。请先帮我澄清几个关键点,再给方案。 </task>
<initial_brief> [你的模糊版本描述] </initial_brief>
<known_constraints> [你已经确定的限制] </known_constraints>
<process>
- 列出 3-5 个能让方案更精准的澄清问题
- 每个问题给 2-3 个选项让我选,不要让我开放回答
- 等我回答完,给出完整方案
- 不要直接猜,不要替我做决策 </process>
怎么改:适合咨询、规划、产品方向类的开放问题。Claude 4.7 本来就喜欢这种模式,强化一下效果更稳定。
Claude 4.7 上常见坑 + 解决方案
| 现象 | 原因 | 解决 |
|---|---|---|
| 默认输出比 4.6 短 | 4.7 按任务复杂度自适应 | 写死字数,或加「provide a comprehensive analysis」 |
| 该用工具时不用 | 4.7 减少工具调用倾向 | 升 effort 到 high 或 xhigh,或显式说明何时该用 |
| 拒绝跨范围推广指令 | 字面理解更严格 | 明说「apply to every section, not just the first one」 |
| 代码 review 报的 bug 少 | 严格遵守”only high severity” | 在 prompt 里改成「report every issue including low severity」 |
| 前端设计总是米色+衬线字体 | 4.7 默认审美偏好 | 给具体的色板和字体名(hex 值最好) |
| 频繁 spawn subagent 浪费 token | 4.7 默认行为 | 明说「don’t spawn subagent for tasks you can do directly」 |
一个 Claude 3.x 老 prompt 升级到 4.7 的真实案例
原 prompt(3.5 时代用了 1 年):
帮我写一份产品周报,给老板看。这周做了:上线了新功能 A、修了 3 个 bug、跟用户聊了 5 次。
3.5 输出:800 字温暖周报,结构完整,带情感色彩
4.7 输出:300 字精简版,缺了用户访谈的洞察,老板看完觉得”少点东西”
问题:4.7 把”给老板看”理解为”要简洁”,并且没自动展开访谈内容。
升级后的 prompt(4.7 friendly):
<role> 你是一位资深产品经理,正在写本周给 CEO 看的产品周报。 </role>
<context>
- CEO 偏好:数据驱动、关注用户洞察、讨厌套话
- 阅读时间:3 分钟
- 本周关键事件:
- 上线新功能 A,灰度 10% 用户,72 小时数据:[填具体数字]
- 修复 3 个 P0 bug:[列 bug 标题]
- 与 5 位流失用户 1v1 访谈:[列每位用户的核心反馈] </context>
<task> 基于上面的 context,写一份周报。 </task>
<format>
一、本周核心 1 句话
[20 字以内]
二、关键数据(必须有数字)
- 指标 1:本周值 / 上周值 / 环比
- 指标 2:…
- 指标 3:…
三、用户洞察(重点,CEO 最关心)
基于 5 个访谈,提炼 3 个洞察。每个洞察「现象 → 推测原因 → 建议动作」三段。
四、下周聚焦
3 件事,每件「目标 + 截止日期」。
五、需要 CEO 决策
列 0-2 个,没有就写「无」。 </format>
<style>
- 不要客套话,不要「本周积极推进」之类的废话
- 每个数据必须给具体数字,不要写「显著提升」
- 总长度 500-700 字 </style>
改了什么:
- 用
<role><context><task><format><style>把信息分层 - 显式列出 5 个访谈的反馈,避免 4.7 自动省略
- 明确每节字数和格式
结果:4.7 给出 650 字高质量周报,CEO 直接转发到管理群。
下一步:把 Claude 用透
读完这篇,建议你:
- 把今天要用的 prompt 按”XML 结构 + 明确 effort + 长内容前置”重写一遍
- 收藏 Anthropic Prompt Library 中文版,里面 62 个官方模板按这套规则写的
- 如果你做 SEO / 内容,看 ChatGPT vs Claude 对比两家差异
- 完全零基础,从 Prompt 是什么 开始
记住一句话:Claude 4 不是变难用了,是它把”清晰”和”模糊”的差距放大了。XML 标签 + 明确 effort + 具体示例,三招打底,质量立刻上一个台阶。
常见问题
Q:Claude 4.7 比 4.6 贵吗?
A:基础单价接近,但 4.7 默认更精简,多数任务实际花费持平或更省。开 xhigh 或 max 时 token 会涨明显,要预估。
Q:XML 标签必须英文吗?
A:建议英文。<task> <context> 这类标签 Claude 训练时见得最多,识别最稳。标签内的内容可以中文。
Q:我用 Claude 网页版没法设 effort,怎么办? A:网页版 Claude.ai 自动用合适的 effort。如果觉得想得浅,prompt 里加「think step by step before responding」效果接近 high effort。
Q:Claude 在国内能用吗? A:直连有难度。看 Claude 国内使用指南 找合适的方案。
Q:Claude 4.7 中文水平怎么样? A:是目前公认最自然的中文大模型,特别适合写作、润色场景。如果做翻译、文学创作,强烈推荐 Claude 4.7 over GPT-5.2。