🤖 AI 跟我学 新手入门

Claude 模型怎么选?Sonnet/Opus/Haiku 2026 对比

Claude 模型怎么选?一篇看完 Opus 4.7/Sonnet 4.6/Haiku 4.5 的速度、能力、上下文、定价对比,附 5 类典型场景的最佳选择

发布 2026/05/06 📎 参考官方文档

一张表看懂 Claude 三个模型

Claude 模型怎么选这件事,2026 年只用记一句话:难任务用 Opus 4.7,日常用 Sonnet 4.6,速度优先用 Haiku 4.5。

Anthropic 目前主推的三个模型,关键参数对比(数据来自 platform.claude.com 官方文档):

维度Opus 4.7Sonnet 4.6Haiku 4.5
定位最强旗舰速度+智能均衡最快小模型
上下文窗口1M token(约 55 万英文词)1M token(约 75 万英文词)200K token(约 15 万英文词)
最大输出128K token64K token64K token
速度中等最快
Extended Thinking
Adaptive Thinking
知识截止2026 年 1 月2025 年 8 月2025 年 2 月
API 输入价(百万 token)5 美元3 美元1 美元
API 输出价(百万 token)25 美元15 美元5 美元

订阅 Pro / Max 的用户在 claude.ai 上能手动切换这三个模型,按场景挑最合适的。下面拆每个模型的「真实定位」和「什么时候用它」。

Opus 4.7:最强旗舰,难任务的兜底

Opus 4.7 是 Anthropic 在 2026 年初发布的最新旗舰,官方原话是「在 Agentic Coding 上有 step-change 提升」。具体是什么意思?

真实表现

我在三类任务上分别测了 Opus 4.7 vs Sonnet 4.6 vs 上一代 Opus 4.6:

任务 1:跨文件代码重构(让 AI 把一个 800 行的 Python 项目按 Clean Architecture 重构)

  • Opus 4.7:一次成功,三个文件的接口完全对齐
  • Sonnet 4.6:能完成,但有两处函数签名不一致
  • Opus 4.6:两次才完成

任务 2:长文档精读 + 总结(80 页英文论文,提取 10 个核心观点 + 反驳点)

  • Opus 4.7:10 个观点准确度 9/10,反驳点深入
  • Sonnet 4.6:10 个观点准确度 9/10,反驳点略浅
  • Opus 4.6:10 个观点准确度 8/10

任务 3:写正式商务英文(写一封拒绝合作的英文回信,要求委婉但立场坚定)

  • Opus 4.7、Sonnet 4.6、Opus 4.6:三者差距小,人类几乎分辨不出

什么时候用 Opus 4.7

  • ✅ 写代码(尤其跨文件重构、找复杂 bug、写算法)
  • ✅ 读长 PDF(50 页以上、需要精读级别理解)
  • ✅ 学术研究(写综述、深入分析、跨多源整合)
  • ✅ 重要决策(请它做利弊分析、风险评估)

什么时候别用 Opus 4.7

  • ❌ 简单问答(浪费用量)
  • ❌ 翻译短段落(Sonnet 已经够)
  • ❌ 要快速响应(Opus 比 Sonnet 慢一些)

注意:Opus 4.7 没有 Extended Thinking

这是个反直觉的细节:旗舰模型 Opus 4.7 不支持 Extended Thinking(深度思考模式),但 Sonnet 4.6 和 Haiku 4.5 都支持。

为什么?官方解释是 Opus 4.7 用了一种新的「自适应思考」(Adaptive Thinking)机制,自己决定要不要深度思考,不需要用户手动切换。

实际影响:如果你要让 AI「显式展示推理过程」(比如数学证明、debug 链路),用 Sonnet 4.6 + Extended Thinking 模式反而比 Opus 4.7 更直观。详见 Claude Extended Thinking 怎么用

Sonnet 4.6:90% 场景的最佳选择

如果只能用一个模型,选 Sonnet 4.6。理由:

三大优势

  1. 速度比 Opus 快:日常对话感受明显,长文档处理也更快出结果
  2. 价格便宜:API 价是 Opus 的 60%($3/15 vs $5/25 per MTok)
  3. 支持 Extended Thinking:能显式展示推理过程

Sonnet 在日常用法上和 Opus 几乎打平

实测下来,下面这些场景 Sonnet 和 Opus 几乎没差别:

  • 翻译(中英、英中、其他主流语言)
  • 写邮件、写报告、写文案
  • 总结文档(10-50 页范围)
  • 写简单代码(200 行以内)
  • 解释概念、辅导学习
  • 头脑风暴

什么时候用 Sonnet 4.6

  • ✅ 90% 的日常使用
  • ✅ 中等难度的写代码(200-500 行)
  • ✅ 中等长度的文档处理(10-50 页)
  • ✅ 需要显式推理过程(开 Extended Thinking)

什么时候升级到 Opus 4.7

  • ⬆️ 跨文件重构、找隐蔽 bug
  • ⬆️ 50 页以上 PDF 的精读
  • ⬆️ 学术综述、深入研究
  • ⬆️ Sonnet 试了一次没做好的难任务

Haiku 4.5:速度优先,给「批量」场景

Haiku 4.5 是三个里最快的,体感差不多是 Sonnet 的 2 倍速度。但它有两个明显短板:

  1. 上下文只有 200K(Opus/Sonnet 都是 1M)—— 长文档场景不够用
  2. 知识截止 2025 年 2 月—— 比 Opus 晚了 11 个月

什么时候用 Haiku 4.5

  • ✅ 短问答、闲聊
  • ✅ 批量处理(比如批量翻译 100 段短文本)
  • ✅ 要超快响应的场景
  • ✅ API 调用预算紧张(最便宜)

什么时候别用 Haiku 4.5

  • ❌ 长文档(>50 页)
  • ❌ 复杂代码任务
  • ❌ 需要 2025 年中后的信息(用 Sonnet 或开 Web Search)
  • ❌ 推理密集型任务

免费版默认的就是 Haiku

如果你用 Claude 免费版,默认模型就是 Haiku 4.5。这也是为什么免费版「感觉够快但回答不够深入」—— 不是免费版偷工减料,是模型本身的定位差异。

详见 Claude 免费版能干什么 教程。

5 类典型场景的最佳选择

场景 1:程序员日常写代码 → Sonnet 4.6 + 复杂任务切 Opus 4.7

  • 普通函数、单元测试 → Sonnet(够用又快)
  • 跨文件重构、复杂算法 → Opus(多花 1-2 倍时间换稳定)
  • 用 Claude Code 跑 Agent → Opus(自适应思考更适合 Agent 流程)

场景 2:写作者写长稿 → Sonnet 4.6 主力

  • 写 5000 字博客 → Sonnet 完全够
  • 写 1 万字深度报道 → Sonnet 一次完成
  • 写小说大纲 + 章节 → Sonnet 主力,让它先用 Extended Thinking 写大纲

场景 3:学生读论文 → Opus 4.7

  • 50 页以上英文论文 → Opus(精读 + 引文准确)
  • 跨多篇论文做综述 → Opus(1M 上下文 + 精读能力)
  • 翻译论文 → Sonnet 已经够

场景 4:商务人士读合同 → Opus 4.7

  • 100 页合同找风险条款 → Opus(精读 + 不漏细节)
  • 中英对照合同审阅 → Opus(双语处理 + 长上下文)
  • 商务邮件、报告 → Sonnet 主力

场景 5:客服、批量任务 → Haiku 4.5

  • 批量翻译短文本 → Haiku(速度最快、成本最低)
  • 客服自动回复模板 → Haiku
  • 批量分类标签 → Haiku

一个帮你选模型的 prompt

每次开始新任务时,先把任务发给 Claude,让它自己推荐用哪个模型:

📋 Prompt 模板

我马上要做一件事,我希望你帮我判断这件事应该用 Claude 的哪个模型来做(Opus 4.7 / Sonnet 4.6 / Haiku 4.5)。

任务描述:[填具体任务,比如「重构一个 500 行的 Python 项目」、「翻译一篇 30 页英文报告」]

我希望的:

  1. 速度优先 / 质量优先 / 成本优先(选一个)
  2. 我能接受的失败率(一次能不能成功)
  3. 我对深度推理的需要程度

请回答:

  1. 应该用哪个模型?
  2. 为什么不是另外两个?
  3. 这个模型在我这个任务上的预估表现(一次成功率、大概耗时)
  4. 如果失败了,要不要升级到更强的模型?

跑两次你就有自己的「模型选择直觉」了。

Claude 历代模型简单回顾

知道当前模型是什么,也要知道它从哪来的。Claude 主要版本演化(按发布时间):

模型发布时间关键特征
Claude 12023 年 3 月Anthropic 第一代
Claude 22023 年 7 月上下文升到 100K
Claude 3 系列2024 年 3 月首次推出 Opus/Sonnet/Haiku 三档命名
Claude 3.5 Sonnet2024 年 6 月当时最佳代码模型
Claude 3.7 / 4 系列2025 年推出 Extended Thinking
Sonnet 4.5 / 4.62025 年 9-11 月上下文升到 1M
Opus 4.62025 年 11 月自适应思考首次出现
Opus 4.7、Sonnet 4.6、Haiku 4.52026 年初当前主力

老模型(Sonnet 4、Opus 4)将在 2026 年 6 月 15 日停服,迁移到 4.6 / 4.7。详见 Claude 4.7 和 4.6 区别 教程。

选模型时常被忽视的 3 件事

1. Pro 套餐能随便切,不要锁死一个

订了 Pro 之后,每段对话开头都能选模型。不要犯「我订了 Pro 就只用 Opus」的错 —— Sonnet 在 90% 场景下体验更好,省下来的用量能用更久。

2. 模型名字里的数字越大不一定越好

Opus 4.6 比 Sonnet 4.6 强 —— 但 Sonnet 4.6 在「速度 + 智能均衡」这个方向上比 Opus 4.7 更适合日常。4.7 > 4.6 只是同档位升级,不是「Opus 4.6 不如 Sonnet 4.7」(其实没有 Sonnet 4.7)。

3. Haiku 不是「鸡肋版」

Haiku 在批量任务和成本敏感场景下是最佳选择,不是「凑数的低配」。Anthropic 把它定位成「near-frontier intelligence」—— 接近前沿能力但最快。

下一步

常见问题

Q:Claude 4.7 和 GPT-5.2 谁更强?

各有所长。Opus 4.7 在代码和长文档上有微弱优势;GPT-5.2 在数学和推理 benchmark 上略高。普通用户感受不出明显差距,看你更需要哪种生态(Claude 的 Projects+Artifacts 还是 GPT 的画图+视频)。

Q:Claude 模型会自动更新吗?

不会。每个模型 ID 都是「固定快照」(pinned snapshot),不是「永远指向最新」。Anthropic 在文档里明确写了:从 4.6 开始的模型 ID 都不是 evergreen pointer。所以你在 API 里指定 claude-opus-4-7 就是这个版本,未来发布 4.8 不会自动替换。

Q:什么是 Extended Thinking?

让模型在回答前显式展示推理过程的功能。开启后回答更慢但更深思。Sonnet 4.6 和 Haiku 4.5 支持,Opus 4.7 不支持(因为它有自适应思考)。详见 Claude Extended Thinking 深度思考

Q:什么是 Adaptive Thinking?

模型自己决定要不要深度思考的机制,是 Opus 4.7 的新特性。简单问题快速答,难问题自己加深度,不需要用户手动切换。

Q:上下文窗口 1M token 到底有多大?

1M token ≈ 75 万英文词 ≈ 50-60 万汉字,能塞下整本《三体》三部曲。但要注意:长上下文消耗的用量是短对话的几十倍,免费版很容易撞 5 小时限额。

Q:Claude Mythos Preview 是什么?

是 Anthropic 在 Project Glasswing 项目下的研究预览模型,专门给「防御性网络安全」工作流用。邀请制、没有自助注册入口,普通用户用不到。

Q:Claude 模型支持中文吗?

支持。Opus 4.7、Sonnet 4.6、Haiku 4.5 都是多语言模型,中文能力很好。但「中文专门优化」的是国产模型(DeepSeek豆包),如果你的工作 100% 中文,国产可能本地化更细。