🤖 AI 跟我学 新手入门

AgentKit 是什么?OpenAI 一站式 Agent 工具

AgentKit 是什么?这篇拆解 OpenAI 2025 DevDay 推出的 AgentKit:Agent Builder、ChatKit、Evals 三大模块、和 Agents SDK 的关系

发布 2026/05/20 📎 参考官方文档

30 秒了解:AgentKit 是什么、为什么 2025 后所有人都在聊

AgentKit 是 OpenAI 在 2025 年 DevDay 推出的一站式 Agent 工具链,把「搭一个能上线的智能体」涉及的几件事都打包了:

  • Agent Builder:拖拉拽搭工作流的可视化画布(对标扣子 / Dify 的工作流编排)
  • ChatKit:可直接嵌入你网站的对话 UI 组件
  • Evals:评估、优化 Agent 表现的工具集
  • 配套的 GuardrailsConnector RegistryWorkflow 导出

用一句话讲清 AgentKit 和 OpenAI Agents SDK 的关系:Agents SDK 是底层代码框架,AgentKit 是覆盖在它之上的可视化产品 + 配套生态。两者不冲突,你可以「在 AgentKit 里搭好原型 → 一键导出成 SDK 代码 → 在自己服务器上跑生产」。

如果你已经会写代码且只做 1-2 个 Agent,直接用 SDK 就够。如果你要搭多个 Agent、要团队协作、要嵌进产品给用户用,AgentKit 能省大量胶水时间

准备工作

项目要求
OpenAI 账号platform.openai.com 注册
API 余额至少充几美元(运行 Agent 会消耗 Token)
网络海外网络环境(国内直连困难)
开发环境想导出代码用得装 Node 或 Python(看 Agents SDK 教程
选做:自家网站想用 ChatKit 嵌入你需要一个能改前端的 Web 项目

AgentKit 的三大核心模块

模块 1:Agent Builder(可视化画布)

Agent Builder 是 AgentKit 最核心的功能,长得像扣子或 Dify 的工作流画布——左边拖节点,右边连线,中间是配置。

支持的核心节点:

节点作用
Agent一个智能体,带指令、模型、工具
Tool函数调用 / 文件搜索 / 代码解释器 / MCP
HandoffAgent 之间的任务转交(多 Agent 协作)
Guardrail在节点间做输入/输出校验
Conditionalif-else 分支
Loop循环处理列表

整个画布的画风和扣子接近,但因为是 OpenAI 自家产品,对 OpenAI 模型的支持最全、最快。新功能(如 GPT-5、Conversations API、最新的 tool 类型)一般第一时间在 Agent Builder 里能用。

模块 2:ChatKit(前端组件库)

ChatKit 是一组 Web 组件,你 5 行代码就能在自家网站嵌一个 Agent 对话框

核心能力:

  • 多端兼容(React / Vue / 原生 JS / Web Component)
  • 内置消息气泡、Markdown 渲染、代码高亮、文件上传
  • 流式输出(边生成边显示)
  • 支持自定义主题色、品牌 Logo、欢迎语

没有 ChatKit 之前,开发者自己实现这一套至少要 1-2 周;有了 ChatKit,下午就能上线

模块 3:Evals(评估和调优)

Evals 是 AgentKit 里被低估但生产环境最重要的模块。它解决「Agent 表现到底好不好」「换 prompt 后是更好还是更差」这种关键问题。

提供的能力:

  • 上传测试用例集(输入 + 期望输出)
  • 自动跑 Agent,对比实际输出 vs 期望
  • 多版本对比(A/B 比较两套 prompt)
  • 看 Trace 找出表现差的环节

这是 Agent 从 demo 推到生产的必备一环——没有 evals 你永远不知道改 prompt 是改好了还是改坏了。

详细操作步骤(Agent Builder 入门)

第 1 步:进入 Agent Builder

登录 platform.openai.com → 左侧导航找 AgentKitAgent Builder 入口,点 New Workflow 创建一个新工作流。

[此处放截图:Agent Builder 主界面]

第 2 步:拖第一个 Agent 节点

从左侧节点栏拖一个 Agent 节点到画布。点这个节点会弹出配置面板:

  • Name:Agent 名字(例:客服 Agent)
  • Instructions:系统提示词
  • Model:选 GPT-5 / 4o / 4o-mini 等
  • Tools:勾选要调用的工具

填好后这个 Agent 就可以试运行了。

第 3 步:加 Tool

点 Agent 节点的 Tools 区域 → Add Tool,能选:

Tool 类型用途
Function自定义函数(要你提供 schema 和后端实现)
Code Interpreter让 Agent 跑 Python 代码
File Search在你上传的文件里检索(自带 RAG)
MCP接入任何 MCP Server
Web Search让 Agent 联网搜索

新手先用 File Search + Code Interpreter 这两个内置工具跑通流程,自定义 Function 等你熟悉了再加。

第 4 步:加 Handoff(多 Agent 协作)

点画布空白处再加一个 Agent,比如「技术支持 Agent」。然后在第一个 Agent 的 Handoffs 配置里把它加进来。

这样跑起来,第一个 Agent 判断到「技术问题」就会把会话整体交给第二个 Agent 处理。这是构建多智能体应用最优雅的范式,比自己写路由器逻辑可读得多。

详细概念看 多智能体协作是什么

第 5 步:加 Guardrails

在节点之间右键 → Add Guardrail,能选:

  • PII Filter:自动屏蔽身份证、银行卡、手机号
  • Topic Filter:限制只回特定话题,越界就拒答
  • Output Schema:强制输出符合 JSON Schema
  • Custom:写一段自定义校验逻辑

Guardrails 应该在生产环境必装——它是防止 Agent 被 prompt 注入、防止泄密的最后一道防线。

第 6 步:跑测试 + 导出代码

画布顶部 Test 按钮跑测试,能看每一步的输入输出和 Trace。满意后两种部署方式:

方式适合谁
直接发布到 OpenAI 云:拿到 endpoint URL,调 API 就能用想最快上线
导出代码:一键导出成 Agents SDK 的 Python / TS 代码,部署到自家服务器要私有部署、要自定义中间层

下面是导出代码后启动 Agent 的最小示例(TypeScript):

import { Agent, run } from '@openai/agents';
// 从 Agent Builder 导出的 agent 定义文件
import { mainAgent } from './exported-agent';

const result = await run(mainAgent, '帮我处理订单 ABC-123');
console.log(result.finalOutput);

5 个 AgentKit 进阶玩法

玩法怎么做
Connector Registry 接外部 SaaSSlack、Notion、GitHub、Linear 等用现成 connector,不用自己接 OAuth
ChatKit + 自家品牌改 theme.json 把对话框配色、Logo、欢迎语改成你品牌的样子
Evals 跑 CI把 evals 集成进 GitHub Actions,prompt 改动自动跑对比,回归不达标就拦下
工作流模板复用把跑通的工作流保存成模板,团队其他人一键 fork
跨工作流编排用 HTTP 节点调另一个 AgentKit 工作流,复杂场景拆模块化

常见坑 + 解决办法

现象原因解决
Agent Builder 加载慢国内网络问题用海外节点 / 直连方案;或导出到本地用 SDK 跑
File Search 检索不准文档分段策略默认在 File Search 配置里调 chunk size 和 overlap
Handoff 后丢上下文不同 Agent 的 instructions 没设好交接规则在目标 Agent 的 instructions 写「从上游接到任务后先复述一遍确认理解」
Token 烧得快多 Agent 串联每步都全量传 history用 Conversations API 自动压缩;或加 summarize 节点
导出代码跑不起来缺依赖 / 环境变量跟着官方导出代码的 README 走;确认 npm install 装齐了
Guardrail 误拦PII Filter 把正常人名也拦了把 Guardrail 模式从 strict 改成 moderate;或自定义白名单

一个完整实战案例:用 AgentKit 搭客户支持工作流

场景:电商网站需要客户支持机器人,能处理 80% 常见问题,复杂问题转人工。

工作流设计:

  1. Greeter Agent:收到用户消息,判断意图分类(订单 / 投诉 / 产品咨询 / 其他)
  2. Handoff 到对应专门 Agent
  3. Order Agent:调 query_order 工具回答订单状态
  4. Product Agent:用 File Search 从产品手册回答
  5. Escalation Agent:投诉类直接转人工,收集联系方式
  6. Guardrails:所有节点之间过 PII Filter,防止用户提供信用卡号被记录

下面这套 Greeter Agent 的 instructions 模板,你可以直接复制到 Agent Builder:

📋 Prompt 模板

你是「[公司名]」官网的迎宾 AI 客服。

任务

  1. 用一句话问候用户
  2. 判断用户意图,归到以下 4 类之一:
    • 订单:查询、物流、退换货
    • 产品:功能、价格、对比
    • 投诉:负面体验、要求经理
    • 其他:不属于上面 3 类

分流规则

  • 订单类 → handoff 给 Order Agent
  • 产品类 → handoff 给 Product Agent
  • 投诉类 → handoff 给 Escalation Agent
  • 其他 → 自己用 1-2 句回答,能答就答,答不了引导转人工

风格

  • 简洁,每次不超过 2 句话
  • 称呼用「您」
  • 不能编造价格、库存、活动信息

边界

  • 不答竞品对比(说「这块我了解有限,可以查官网或转客服」)
  • 不答任何政治、宗教、法律建议

整套搭好后前端用 ChatKit 嵌进官网右下角对话气泡,Evals 每周跑一次回归测试。一个团队一周内能跑通从 0 到上线。

进阶 / 下一步

常见问题

Q:AgentKit 和 GPTs 有啥区别? A:GPTs 是给最终用户在 ChatGPT 里玩的轻量自定义 Agent,门槛极低但能力受限(没有 Handoff、没有 Evals、不能嵌入第三方)。AgentKit 是给开发者搭企业级 Agent 应用的工具链,能力强大但需要点开发功底。两者面向不同人群。

Q:AgentKit 收费吗? A:AgentKit 本身使用不额外收费,真实成本是底层模型调用和存储(按 OpenAI 标准 API 价计费)。生产环境的主要开销是 Token,跟你 Agent 跑多频繁强相关。

Q:AgentKit 支持非 OpenAI 模型吗? A:官方主推 OpenAI 自家模型(GPT-5、4o 等)。理论上通过自定义 endpoint 可以接 OpenAI 兼容接口(如 Azure、DeepSeek 等),但部分高级功能(如 Conversations API 持久化)只在 OpenAI 自家可用。

Q:AgentKit 和扣子 / Dify 怎么选? A:和 OpenAI 生态深度绑定 → AgentKit国内用户、要私有部署、要中文支持最佳 → 扣子 / Dify两者都试过的团队不少同时用——AgentKit 处理海外 GPT-5 业务,Dify 处理国内私有部署业务。

Q:导出的代码能跑在自家服务器上吗? A:能。这是 AgentKit 最大的优势之一——你可以「在 OpenAI 云上设计 → 导出代码 → 部署到 AWS/GCP/阿里云」,不被锁死。

Q:AgentKit 现在稳定吗,可以生产用了吗? A:截至 2026 年 5 月,Agent Builder 和 ChatKit 已经 GA(正式发布),Evals 部分功能仍在迭代。生产用要做好版本锁定 + 充分测试,重要业务不要直接跟最新 beta。