Hermes Agent 引入 Tool Search 解决 MCP 上下文膨胀,Anthropic 评测显示 Opus 4 准确率从 49% 提升至 74
Nous Research 的开源 Hermes Agent 新增 Tool Search 功能,通过 BM25 渐进式披露解决 MCP 工具上下文膨胀问题。Anthropic 内部评测显示,Claude Opus 4 准确率从 49% 提升至 74%,Opus 4.5 从 79.5% 提升至 88.1%,同时工具定义 token 使用量减少 85%。了解这一技术如何降低成本和提升模型决…
一句话看懂
Nous Research 开源 Hermes Agent 新增 Tool Search 功能,通过 BM25 检索按需加载 MCP 工具 schema,将 Claude Opus 4 准确率从 49% 提升至 74%。
详细发生了什么
AI agent 系统正面临一个日益严重的瓶颈:连接多个 MCP 服务器时,每个工具的 JSON schema 都会在每轮对话中被发送给模型,即使模型只需要其中一两个。Nous Research 的开源 Hermes Agent 现在推出了 Tool Search 功能,直接解决这个问题。
Tool Search 是一个渐进式披露层,用三个轻量级桥接工具替换模型可见的工具数组:tool_search(query, limit?)、tool_describe(name) 和 tool_call(name, arguments)。模型先通过 BM25 算法搜索工具目录,然后按需加载完整 schema,最后调用工具。所有钩子、护栏和审批提示仍然针对真实工具名称运行。
Anthropic 的内部 MCP 评测显示准确率显著提升:Claude Opus 4 从 49% 提升至 74%,Claude Opus 4.5 从 79.5% 提升至 88.1%。同时,工具定义 token 使用量减少 85%。
中文圈视角
对中文开发者来说,这个功能直接解决了使用 MCP 协议时的高成本和低效问题。国内用户如果通过 API 调用 Claude 或本地部署 Hermes Agent,Tool Search 能显著降低每次调用的 token 消耗——一个 5 个 MCP 服务器、34 个工具的场景,每轮对话可节省约 22,000 token,按 API 价格计算,每次 cache-miss 调用可节省 $0.07-$0.10。
国产模型如 DeepSeek、Kimi 目前尚未原生支持类似机制,但 MCP 协议本身是开放的。如果国内开发者想复现类似方案,可以基于 BM25 或更轻量的检索算法自行实现渐进式 schema 披露。值得注意的是,Tool Search 的 BM25 回退到子串匹配的设计,对中文工具名(如“创建GitHub问题”)同样有效,但中文分词可能需要额外处理。
目前中文社区对这一技术的讨论较少,多数焦点仍在模型能力本身。实际上,对于构建复杂 agent 的团队,工具上下文管理可能是比模型选型更紧迫的工程瓶颈。
几条值得记住的细节
- 默认自动模式:Tool Search 仅在可延迟工具 schema 占用超过模型上下文窗口 10% 时激活,低于阈值则完全透传,零开销。
- BM25 + 回退:检索使用 BM25 算法匹配工具名称、描述和参数名,若 BM25 无正分命中,则回退到工具名字符串子串匹配。
- 无状态目录:工具目录每轮对话重建,防止存储的目录与实时工具注册表不同步。
- 配置灵活:可在 hermes.yaml 中设置
enabled: auto/on/off、threshold_pct、search_default_limit等参数。 - Anthropic 数据:工具定义 token 使用量减少 85%,同时保持对完整工具库的访问。
一句话总结
Tool Search 让 MCP 工具调用不再“吃”掉你的上下文窗口——按需加载 schema 既省钱又提升模型决策准确率。