Hermes Agent 引入 Tool Search 解决 MCP 上下文膨胀，Anthropic 评测显示 Opus 4 准确率从 49% 提升至 74

一句话看懂

Nous Research 开源 Hermes Agent 新增 Tool Search 功能，通过 BM25 检索按需加载 MCP 工具 schema，将 Claude Opus 4 准确率从 49% 提升至 74%。

详细发生了什么

AI agent 系统正面临一个日益严重的瓶颈：连接多个 MCP 服务器时，每个工具的 JSON schema 都会在每轮对话中被发送给模型，即使模型只需要其中一两个。Nous Research 的开源 Hermes Agent 现在推出了 Tool Search 功能，直接解决这个问题。

Tool Search 是一个渐进式披露层，用三个轻量级桥接工具替换模型可见的工具数组：tool_search(query, limit?)、tool_describe(name) 和 tool_call(name, arguments)。模型先通过 BM25 算法搜索工具目录，然后按需加载完整 schema，最后调用工具。所有钩子、护栏和审批提示仍然针对真实工具名称运行。

Anthropic 的内部 MCP 评测显示准确率显著提升：Claude Opus 4 从 49% 提升至 74%，Claude Opus 4.5 从 79.5% 提升至 88.1%。同时，工具定义 token 使用量减少 85%。

中文圈视角

对中文开发者来说，这个功能直接解决了使用 MCP 协议时的高成本和低效问题。国内用户如果通过 API 调用 Claude 或本地部署 Hermes Agent，Tool Search 能显著降低每次调用的 token 消耗——一个 5 个 MCP 服务器、34 个工具的场景，每轮对话可节省约 22,000 token，按 API 价格计算，每次 cache-miss 调用可节省 $0.07-$0.10。

国产模型如 DeepSeek、Kimi 目前尚未原生支持类似机制，但 MCP 协议本身是开放的。如果国内开发者想复现类似方案，可以基于 BM25 或更轻量的检索算法自行实现渐进式 schema 披露。值得注意的是，Tool Search 的 BM25 回退到子串匹配的设计，对中文工具名（如“创建GitHub问题”）同样有效，但中文分词可能需要额外处理。

目前中文社区对这一技术的讨论较少，多数焦点仍在模型能力本身。实际上，对于构建复杂 agent 的团队，工具上下文管理可能是比模型选型更紧迫的工程瓶颈。

几条值得记住的细节

默认自动模式：Tool Search 仅在可延迟工具 schema 占用超过模型上下文窗口 10% 时激活，低于阈值则完全透传，零开销。
BM25 + 回退：检索使用 BM25 算法匹配工具名称、描述和参数名，若 BM25 无正分命中，则回退到工具名字符串子串匹配。
无状态目录：工具目录每轮对话重建，防止存储的目录与实时工具注册表不同步。
配置灵活：可在 hermes.yaml 中设置 enabled: auto/on/off、threshold_pct、search_default_limit 等参数。
Anthropic 数据：工具定义 token 使用量减少 85%，同时保持对完整工具库的访问。

一句话总结

Tool Search 让 MCP 工具调用不再“吃”掉你的上下文窗口——按需加载 schema 既省钱又提升模型决策准确率。