Nous Research 发布 Hermes Desktop:开源 AI Agent 的跨平台桌面端,支持流式工具输出
Nous Research 推出 Hermes Desktop 公开预览版,为开源 Hermes Agent 提供原生 macOS/Windows/Linux 图形界面。无需终端即可使用,支持流式工具输出、跨会话记忆、自改进技能,并与 CLI 共享核心和配置。本文详解功能、中文用户适用性及国产替代对比。
一句话看懂
Nous Research 发布 Hermes Desktop,为开源 Hermes Agent 提供原生跨平台桌面端,无需终端即可使用流式工具输出和持久记忆。
详细发生了什么
Nous Research 于 2026 年 6 月 2 日发布 Hermes Desktop 公开预览版。这是一款原生 macOS、Windows 和 Linux 应用,为开源 Hermes Agent 提供图形界面。此前用户只能通过 CLI 和消息网关使用 Hermes。当前版本基于 Hermes Agent v0.15.2。
桌面端复用同一 agent 核心,与 CLI 和网关共享配置、API key、会话、技能和记忆。它不是一个分支,而是同一 agent 的另一个界面。Hermes 不是代码补全工具,而是一个自主 AI agent:模型在循环中规划、行动、观察。桌面端窗口显示流式响应和实时工具活动,右侧面板预览网页、文件和工具输出,还包含文件浏览器、语音输入输出和设置界面。
会话在所有界面间共享:在桌面端开始的对话可在 CLI 或 TUI 中继续,反之亦然。macOS 和 Windows 提供直接安装程序,Linux 通过终端安装(需 —include-desktop 标志)。
Hermes 的核心特性是“闭环学习”:复杂任务后 agent 会编写可复用的技能,这些技能在后续使用中自我改进。记忆是持久且由 agent 管理的,定期提示保存知识。跨会话回忆使用 FTS5 会话搜索加 LLM 摘要,用户建模通过 Honcho dialectic 实现。
Hermes 通过单一网关连接多个消息平台:Telegram、Discord、Slack、WhatsApp、Signal、Email 和 CLI。任务可在不同平台间切换。调度支持自然语言触发报告、备份和简报,通过内置 cron 调度器无人值守运行。委托功能可生成隔离的子 agent,每个子 agent 有自己的对话和终端。Python RPC 脚本可将多步管道压缩为零上下文成本的轮次。
执行沙箱支持五种后端:local、Docker、SSH、Singularity 和 Modal,并应用容器加固和命名空间隔离。内置工具包括网页搜索、浏览器自动化、视觉、图像生成、语音合成和多模型推理。外部工具通过 MCP(Model Context Protocol)连接。
Hermes 与任何提供商兼容,API key 可选。Nous Portal 提供统一订阅:Free、Plus、Super 和 Ultra 四档,付费档包含月度积分和 300+ 模型访问,以及内置工具使用。工具网关将多个工具路由到一个账户:网页搜索使用 Firecrawl,图像生成使用 FAL,语音合成使用 OpenAI,云浏览器使用 Browser Use。
项目采用 MIT 许可证,允许审计、自托管和修改。
中文圈视角
Hermes Desktop 对中文用户来说,门槛主要在两方面:一是需要访问外网(GitHub、Nous Portal 等),二是模型默认依赖海外 API。不过,Hermes 是模型无关的,可以接入国产模型 API(如 DeepSeek、智谱 GLM、通义千问),只需修改 endpoint 配置。这意味着国内开发者可以自建类似体验,但需要自行处理网络和合规问题。
国产同类产品方面,目前没有直接对标 Hermes 的开源自主 agent 桌面端。Kimi 和 DeepSeek 主要提供聊天和文件处理,缺乏持久记忆、自改进技能和跨平台调度。智谱的 Agent 平台(如 AutoGLM)更偏向云端,没有原生桌面端。Hermes 的“闭环学习”和“跨会话记忆”在中文开源社区中仍是空白,但 ModelScope 上有一些实验性项目。
对中文用户的具体场景:编程辅助(Hermes 可执行代码、调用工具)、自动化办公(自然语言调度任务)、知识管理(持久记忆和技能复用)都有潜力。但需要注意数据安全:如果使用海外 API,数据可能出境;自托管可避免,但需要技术能力。
一个中文圈尚未讨论的盲点:Hermes 的“技能”采用 agentskills.io 开放标准,这意味着未来可能出现中文技能市场,类似 Hugging Face 的模型库。国内平台如 ModelScope 或阿里云可以借鉴此模式。
几条值得记住的细节
- Hermes Desktop 当前为公开预览版,可能存在不稳定之处。
- 桌面端与 CLI 共享同一 agent 核心,会话可在不同界面间无缝切换。
- 支持五种沙箱后端:local、Docker、SSH、Singularity、Modal,执行环境隔离。
- 内置工具包括网页搜索、浏览器自动化、图像生成、语音合成等,外部工具通过 MCP 连接。
- Nous Portal 免费档可用,付费档从 Plus 起,提供月度积分和 300+ 模型访问。
一句话总结
Hermes Desktop 让自主 AI agent 有了好用的图形界面,中文用户可自托管接入国产模型,但需注意网络和合规问题。