AgentKit 是什么?OpenAI 一站式 Agent 工具
AgentKit 是什么?这篇拆解 OpenAI 2025 DevDay 推出的 AgentKit:Agent Builder、ChatKit、Evals 三大模块、和 Agents SDK 的关系
30 秒了解:AgentKit 是什么、为什么 2025 后所有人都在聊
AgentKit 是 OpenAI 在 2025 年 DevDay 推出的一站式 Agent 工具链,把「搭一个能上线的智能体」涉及的几件事都打包了:
- Agent Builder:拖拉拽搭工作流的可视化画布(对标扣子 / Dify 的工作流编排)
- ChatKit:可直接嵌入你网站的对话 UI 组件
- Evals:评估、优化 Agent 表现的工具集
- 配套的 Guardrails、Connector Registry、Workflow 导出等
用一句话讲清 AgentKit 和 OpenAI Agents SDK 的关系:Agents SDK 是底层代码框架,AgentKit 是覆盖在它之上的可视化产品 + 配套生态。两者不冲突,你可以「在 AgentKit 里搭好原型 → 一键导出成 SDK 代码 → 在自己服务器上跑生产」。
如果你已经会写代码且只做 1-2 个 Agent,直接用 SDK 就够。如果你要搭多个 Agent、要团队协作、要嵌进产品给用户用,AgentKit 能省大量胶水时间。
准备工作
| 项目 | 要求 |
|---|---|
| OpenAI 账号 | platform.openai.com 注册 |
| API 余额 | 至少充几美元(运行 Agent 会消耗 Token) |
| 网络 | 海外网络环境(国内直连困难) |
| 开发环境 | 想导出代码用得装 Node 或 Python(看 Agents SDK 教程) |
| 选做:自家网站 | 想用 ChatKit 嵌入你需要一个能改前端的 Web 项目 |
AgentKit 的三大核心模块
模块 1:Agent Builder(可视化画布)
Agent Builder 是 AgentKit 最核心的功能,长得像扣子或 Dify 的工作流画布——左边拖节点,右边连线,中间是配置。
支持的核心节点:
| 节点 | 作用 |
|---|---|
| Agent | 一个智能体,带指令、模型、工具 |
| Tool | 函数调用 / 文件搜索 / 代码解释器 / MCP |
| Handoff | Agent 之间的任务转交(多 Agent 协作) |
| Guardrail | 在节点间做输入/输出校验 |
| Conditional | if-else 分支 |
| Loop | 循环处理列表 |
整个画布的画风和扣子接近,但因为是 OpenAI 自家产品,对 OpenAI 模型的支持最全、最快。新功能(如 GPT-5、Conversations API、最新的 tool 类型)一般第一时间在 Agent Builder 里能用。
模块 2:ChatKit(前端组件库)
ChatKit 是一组 Web 组件,你 5 行代码就能在自家网站嵌一个 Agent 对话框。
核心能力:
- 多端兼容(React / Vue / 原生 JS / Web Component)
- 内置消息气泡、Markdown 渲染、代码高亮、文件上传
- 流式输出(边生成边显示)
- 支持自定义主题色、品牌 Logo、欢迎语
没有 ChatKit 之前,开发者自己实现这一套至少要 1-2 周;有了 ChatKit,下午就能上线。
模块 3:Evals(评估和调优)
Evals 是 AgentKit 里被低估但生产环境最重要的模块。它解决「Agent 表现到底好不好」「换 prompt 后是更好还是更差」这种关键问题。
提供的能力:
- 上传测试用例集(输入 + 期望输出)
- 自动跑 Agent,对比实际输出 vs 期望
- 多版本对比(A/B 比较两套 prompt)
- 看 Trace 找出表现差的环节
这是 Agent 从 demo 推到生产的必备一环——没有 evals 你永远不知道改 prompt 是改好了还是改坏了。
详细操作步骤(Agent Builder 入门)
第 1 步:进入 Agent Builder
登录 platform.openai.com → 左侧导航找 AgentKit 或 Agent Builder 入口,点 New Workflow 创建一个新工作流。
[此处放截图:Agent Builder 主界面]
第 2 步:拖第一个 Agent 节点
从左侧节点栏拖一个 Agent 节点到画布。点这个节点会弹出配置面板:
- Name:Agent 名字(例:客服 Agent)
- Instructions:系统提示词
- Model:选 GPT-5 / 4o / 4o-mini 等
- Tools:勾选要调用的工具
填好后这个 Agent 就可以试运行了。
第 3 步:加 Tool
点 Agent 节点的 Tools 区域 → Add Tool,能选:
| Tool 类型 | 用途 |
|---|---|
| Function | 自定义函数(要你提供 schema 和后端实现) |
| Code Interpreter | 让 Agent 跑 Python 代码 |
| File Search | 在你上传的文件里检索(自带 RAG) |
| MCP | 接入任何 MCP Server |
| Web Search | 让 Agent 联网搜索 |
新手先用 File Search + Code Interpreter 这两个内置工具跑通流程,自定义 Function 等你熟悉了再加。
第 4 步:加 Handoff(多 Agent 协作)
点画布空白处再加一个 Agent,比如「技术支持 Agent」。然后在第一个 Agent 的 Handoffs 配置里把它加进来。
这样跑起来,第一个 Agent 判断到「技术问题」就会把会话整体交给第二个 Agent 处理。这是构建多智能体应用最优雅的范式,比自己写路由器逻辑可读得多。
详细概念看 多智能体协作是什么。
第 5 步:加 Guardrails
在节点之间右键 → Add Guardrail,能选:
- PII Filter:自动屏蔽身份证、银行卡、手机号
- Topic Filter:限制只回特定话题,越界就拒答
- Output Schema:强制输出符合 JSON Schema
- Custom:写一段自定义校验逻辑
Guardrails 应该在生产环境必装——它是防止 Agent 被 prompt 注入、防止泄密的最后一道防线。
第 6 步:跑测试 + 导出代码
画布顶部 Test 按钮跑测试,能看每一步的输入输出和 Trace。满意后两种部署方式:
| 方式 | 适合谁 |
|---|---|
| 直接发布到 OpenAI 云:拿到 endpoint URL,调 API 就能用 | 想最快上线 |
| 导出代码:一键导出成 Agents SDK 的 Python / TS 代码,部署到自家服务器 | 要私有部署、要自定义中间层 |
下面是导出代码后启动 Agent 的最小示例(TypeScript):
import { Agent, run } from '@openai/agents';
// 从 Agent Builder 导出的 agent 定义文件
import { mainAgent } from './exported-agent';
const result = await run(mainAgent, '帮我处理订单 ABC-123');
console.log(result.finalOutput);
5 个 AgentKit 进阶玩法
| 玩法 | 怎么做 |
|---|---|
| Connector Registry 接外部 SaaS | Slack、Notion、GitHub、Linear 等用现成 connector,不用自己接 OAuth |
| ChatKit + 自家品牌 | 改 theme.json 把对话框配色、Logo、欢迎语改成你品牌的样子 |
| Evals 跑 CI | 把 evals 集成进 GitHub Actions,prompt 改动自动跑对比,回归不达标就拦下 |
| 工作流模板复用 | 把跑通的工作流保存成模板,团队其他人一键 fork |
| 跨工作流编排 | 用 HTTP 节点调另一个 AgentKit 工作流,复杂场景拆模块化 |
常见坑 + 解决办法
| 现象 | 原因 | 解决 |
|---|---|---|
| Agent Builder 加载慢 | 国内网络问题 | 用海外节点 / 直连方案;或导出到本地用 SDK 跑 |
| File Search 检索不准 | 文档分段策略默认 | 在 File Search 配置里调 chunk size 和 overlap |
| Handoff 后丢上下文 | 不同 Agent 的 instructions 没设好交接规则 | 在目标 Agent 的 instructions 写「从上游接到任务后先复述一遍确认理解」 |
| Token 烧得快 | 多 Agent 串联每步都全量传 history | 用 Conversations API 自动压缩;或加 summarize 节点 |
| 导出代码跑不起来 | 缺依赖 / 环境变量 | 跟着官方导出代码的 README 走;确认 npm install 装齐了 |
| Guardrail 误拦 | PII Filter 把正常人名也拦了 | 把 Guardrail 模式从 strict 改成 moderate;或自定义白名单 |
一个完整实战案例:用 AgentKit 搭客户支持工作流
场景:电商网站需要客户支持机器人,能处理 80% 常见问题,复杂问题转人工。
工作流设计:
- Greeter Agent:收到用户消息,判断意图分类(订单 / 投诉 / 产品咨询 / 其他)
- Handoff 到对应专门 Agent
- Order Agent:调 query_order 工具回答订单状态
- Product Agent:用 File Search 从产品手册回答
- Escalation Agent:投诉类直接转人工,收集联系方式
- Guardrails:所有节点之间过 PII Filter,防止用户提供信用卡号被记录
下面这套 Greeter Agent 的 instructions 模板,你可以直接复制到 Agent Builder:
你是「[公司名]」官网的迎宾 AI 客服。
任务
- 用一句话问候用户
- 判断用户意图,归到以下 4 类之一:
- 订单:查询、物流、退换货
- 产品:功能、价格、对比
- 投诉:负面体验、要求经理
- 其他:不属于上面 3 类
分流规则
- 订单类 → handoff 给 Order Agent
- 产品类 → handoff 给 Product Agent
- 投诉类 → handoff 给 Escalation Agent
- 其他 → 自己用 1-2 句回答,能答就答,答不了引导转人工
风格
- 简洁,每次不超过 2 句话
- 称呼用「您」
- 不能编造价格、库存、活动信息
边界
- 不答竞品对比(说「这块我了解有限,可以查官网或转客服」)
- 不答任何政治、宗教、法律建议
整套搭好后前端用 ChatKit 嵌进官网右下角对话气泡,Evals 每周跑一次回归测试。一个团队一周内能跑通从 0 到上线。
进阶 / 下一步
- OpenAI Agents SDK 是什么?开发者上手指南:AgentKit 的底层代码框架
- ChatGPT Agent 模式怎么用?:终端用户视角的 Agent
- GPT Builder 实战:OpenAI 另一条产品线(轻量 GPTs)
- 扣子 vs Dify vs FastGPT 对比:国内同类产品横评
- AI Agent 工作流是什么:理解 workflow 的通用概念
常见问题
Q:AgentKit 和 GPTs 有啥区别? A:GPTs 是给最终用户在 ChatGPT 里玩的轻量自定义 Agent,门槛极低但能力受限(没有 Handoff、没有 Evals、不能嵌入第三方)。AgentKit 是给开发者搭企业级 Agent 应用的工具链,能力强大但需要点开发功底。两者面向不同人群。
Q:AgentKit 收费吗? A:AgentKit 本身使用不额外收费,真实成本是底层模型调用和存储(按 OpenAI 标准 API 价计费)。生产环境的主要开销是 Token,跟你 Agent 跑多频繁强相关。
Q:AgentKit 支持非 OpenAI 模型吗? A:官方主推 OpenAI 自家模型(GPT-5、4o 等)。理论上通过自定义 endpoint 可以接 OpenAI 兼容接口(如 Azure、DeepSeek 等),但部分高级功能(如 Conversations API 持久化)只在 OpenAI 自家可用。
Q:AgentKit 和扣子 / Dify 怎么选? A:和 OpenAI 生态深度绑定 → AgentKit;国内用户、要私有部署、要中文支持最佳 → 扣子 / Dify;两者都试过的团队不少同时用——AgentKit 处理海外 GPT-5 业务,Dify 处理国内私有部署业务。
Q:导出的代码能跑在自家服务器上吗? A:能。这是 AgentKit 最大的优势之一——你可以「在 OpenAI 云上设计 → 导出代码 → 部署到 AWS/GCP/阿里云」,不被锁死。
Q:AgentKit 现在稳定吗,可以生产用了吗? A:截至 2026 年 5 月,Agent Builder 和 ChatKit 已经 GA(正式发布),Evals 部分功能仍在迭代。生产用要做好版本锁定 + 充分测试,重要业务不要直接跟最新 beta。