30 秒了解：AgentKit 是什么、为什么 2025 后所有人都在聊

AgentKit 是 OpenAI 在 2025 年 DevDay 推出的一站式 Agent 工具链，把「搭一个能上线的智能体」涉及的几件事都打包了：

Agent Builder：拖拉拽搭工作流的可视化画布（对标扣子 / Dify 的工作流编排）
ChatKit：可直接嵌入你网站的对话 UI 组件
Evals：评估、优化 Agent 表现的工具集
配套的 Guardrails、Connector Registry、Workflow 导出等

用一句话讲清 AgentKit 和 OpenAI Agents SDK 的关系：Agents SDK 是底层代码框架，AgentKit 是覆盖在它之上的可视化产品 + 配套生态。两者不冲突，你可以「在 AgentKit 里搭好原型 → 一键导出成 SDK 代码 → 在自己服务器上跑生产」。

如果你已经会写代码且只做 1-2 个 Agent，直接用 SDK 就够。如果你要搭多个 Agent、要团队协作、要嵌进产品给用户用，AgentKit 能省大量胶水时间。

准备工作

项目	要求
OpenAI 账号	platform.openai.com 注册
API 余额	至少充几美元（运行 Agent 会消耗 Token）
网络	海外网络环境（国内直连困难）
开发环境	想导出代码用得装 Node 或 Python（看 Agents SDK 教程）
选做：自家网站	想用 ChatKit 嵌入你需要一个能改前端的 Web 项目

AgentKit 的三大核心模块

模块 1：Agent Builder（可视化画布）

Agent Builder 是 AgentKit 最核心的功能，长得像扣子或 Dify 的工作流画布——左边拖节点，右边连线，中间是配置。

支持的核心节点：

节点	作用
Agent	一个智能体，带指令、模型、工具
Tool	函数调用 / 文件搜索 / 代码解释器 / MCP
Handoff	Agent 之间的任务转交（多 Agent 协作）
Guardrail	在节点间做输入/输出校验
Conditional	if-else 分支
Loop	循环处理列表

整个画布的画风和扣子接近，但因为是 OpenAI 自家产品，对 OpenAI 模型的支持最全、最快。新功能（如 GPT-5、Conversations API、最新的 tool 类型）一般第一时间在 Agent Builder 里能用。

模块 2：ChatKit（前端组件库）

ChatKit 是一组 Web 组件，你 5 行代码就能在自家网站嵌一个 Agent 对话框。

核心能力：

多端兼容（React / Vue / 原生 JS / Web Component）
内置消息气泡、Markdown 渲染、代码高亮、文件上传
流式输出（边生成边显示）
支持自定义主题色、品牌 Logo、欢迎语

没有 ChatKit 之前，开发者自己实现这一套至少要 1-2 周；有了 ChatKit，下午就能上线。

模块 3：Evals（评估和调优）

Evals 是 AgentKit 里被低估但生产环境最重要的模块。它解决「Agent 表现到底好不好」「换 prompt 后是更好还是更差」这种关键问题。

提供的能力：

上传测试用例集（输入 + 期望输出）
自动跑 Agent，对比实际输出 vs 期望
多版本对比（A/B 比较两套 prompt）
看 Trace 找出表现差的环节

这是 Agent 从 demo 推到生产的必备一环——没有 evals 你永远不知道改 prompt 是改好了还是改坏了。

详细操作步骤（Agent Builder 入门）

第 1 步：进入 Agent Builder

[此处放截图：Agent Builder 主界面]

第 2 步：拖第一个 Agent 节点

从左侧节点栏拖一个 Agent 节点到画布。点这个节点会弹出配置面板：

Name：Agent 名字（例：客服 Agent）
Instructions：系统提示词
Model：选 GPT-5 / 4o / 4o-mini 等
Tools：勾选要调用的工具

填好后这个 Agent 就可以试运行了。

第 3 步：加 Tool

点 Agent 节点的 Tools 区域 → Add Tool，能选：

Tool 类型	用途
Function	自定义函数（要你提供 schema 和后端实现）
Code Interpreter	让 Agent 跑 Python 代码
File Search	在你上传的文件里检索（自带 RAG）
MCP	接入任何 MCP Server
Web Search	让 Agent 联网搜索

新手先用 File Search + Code Interpreter 这两个内置工具跑通流程，自定义 Function 等你熟悉了再加。

第 4 步：加 Handoff（多 Agent 协作）

点画布空白处再加一个 Agent，比如「技术支持 Agent」。然后在第一个 Agent 的 Handoffs 配置里把它加进来。

这样跑起来，第一个 Agent 判断到「技术问题」就会把会话整体交给第二个 Agent 处理。这是构建多智能体应用最优雅的范式，比自己写路由器逻辑可读得多。

详细概念看多智能体协作是什么。

第 5 步：加 Guardrails

在节点之间右键 → Add Guardrail，能选：

PII Filter：自动屏蔽身份证、银行卡、手机号
Topic Filter：限制只回特定话题，越界就拒答
Output Schema：强制输出符合 JSON Schema
Custom：写一段自定义校验逻辑

Guardrails 应该在生产环境必装——它是防止 Agent 被 prompt 注入、防止泄密的最后一道防线。

第 6 步：跑测试 + 导出代码

画布顶部 Test 按钮跑测试，能看每一步的输入输出和 Trace。满意后两种部署方式：

方式	适合谁
直接发布到 OpenAI 云：拿到 endpoint URL，调 API 就能用	想最快上线
导出代码：一键导出成 Agents SDK 的 Python / TS 代码，部署到自家服务器	要私有部署、要自定义中间层

下面是导出代码后启动 Agent 的最小示例（TypeScript）：

import { Agent, run } from '@openai/agents';
// 从 Agent Builder 导出的 agent 定义文件
import { mainAgent } from './exported-agent';

const result = await run(mainAgent, '帮我处理订单 ABC-123');
console.log(result.finalOutput);

5 个 AgentKit 进阶玩法

玩法	怎么做
Connector Registry 接外部 SaaS	Slack、Notion、GitHub、Linear 等用现成 connector，不用自己接 OAuth
ChatKit + 自家品牌	改 theme.json 把对话框配色、Logo、欢迎语改成你品牌的样子
Evals 跑 CI	把 evals 集成进 GitHub Actions，prompt 改动自动跑对比，回归不达标就拦下
工作流模板复用	把跑通的工作流保存成模板，团队其他人一键 fork
跨工作流编排	用 HTTP 节点调另一个 AgentKit 工作流，复杂场景拆模块化

常见坑 + 解决办法

现象	原因	解决
Agent Builder 加载慢	国内网络问题	用海外节点 / 直连方案；或导出到本地用 SDK 跑
File Search 检索不准	文档分段策略默认	在 File Search 配置里调 chunk size 和 overlap
Handoff 后丢上下文	不同 Agent 的 instructions 没设好交接规则	在目标 Agent 的 instructions 写「从上游接到任务后先复述一遍确认理解」
Token 烧得快	多 Agent 串联每步都全量传 history	用 Conversations API 自动压缩；或加 summarize 节点
导出代码跑不起来	缺依赖 / 环境变量	跟着官方导出代码的 README 走；确认 `npm install` 装齐了
Guardrail 误拦	PII Filter 把正常人名也拦了	把 Guardrail 模式从 strict 改成 moderate；或自定义白名单

一个完整实战案例：用 AgentKit 搭客户支持工作流

场景：电商网站需要客户支持机器人，能处理 80% 常见问题，复杂问题转人工。

工作流设计：

Greeter Agent：收到用户消息，判断意图分类（订单 / 投诉 / 产品咨询 / 其他）
Handoff 到对应专门 Agent
Order Agent：调 query_order 工具回答订单状态
Product Agent：用 File Search 从产品手册回答
Escalation Agent：投诉类直接转人工，收集联系方式
Guardrails：所有节点之间过 PII Filter，防止用户提供信用卡号被记录

下面这套 Greeter Agent 的 instructions 模板，你可以直接复制到 Agent Builder：

📋 Prompt 模板

你是「[公司名]」官网的迎宾 AI 客服。

任务

用一句话问候用户
判断用户意图，归到以下 4 类之一：
- 订单：查询、物流、退换货
- 产品：功能、价格、对比
- 投诉：负面体验、要求经理
- 其他：不属于上面 3 类

分流规则

订单类 → handoff 给 Order Agent
产品类 → handoff 给 Product Agent
投诉类 → handoff 给 Escalation Agent
其他 → 自己用 1-2 句回答，能答就答，答不了引导转人工

风格

简洁，每次不超过 2 句话
称呼用「您」
不能编造价格、库存、活动信息

边界

不答竞品对比（说「这块我了解有限，可以查官网或转客服」）
不答任何政治、宗教、法律建议

整套搭好后前端用 ChatKit 嵌进官网右下角对话气泡，Evals 每周跑一次回归测试。一个团队一周内能跑通从 0 到上线。

进阶 / 下一步

OpenAI Agents SDK 是什么？开发者上手指南：AgentKit 的底层代码框架
ChatGPT Agent 模式怎么用？：终端用户视角的 Agent
GPT Builder 实战：OpenAI 另一条产品线（轻量 GPTs）
扣子 vs Dify vs FastGPT 对比：国内同类产品横评
AI Agent 工作流是什么：理解 workflow 的通用概念

常见问题

Q：AgentKit 和 GPTs 有啥区别？ A：GPTs 是给最终用户在 ChatGPT 里玩的轻量自定义 Agent，门槛极低但能力受限（没有 Handoff、没有 Evals、不能嵌入第三方）。AgentKit 是给开发者搭企业级 Agent 应用的工具链，能力强大但需要点开发功底。两者面向不同人群。

Q：AgentKit 收费吗？ A：AgentKit 本身使用不额外收费，真实成本是底层模型调用和存储（按 OpenAI 标准 API 价计费）。生产环境的主要开销是 Token，跟你 Agent 跑多频繁强相关。

Q：AgentKit 支持非 OpenAI 模型吗？ A：官方主推 OpenAI 自家模型（GPT-5、4o 等）。理论上通过自定义 endpoint 可以接 OpenAI 兼容接口（如 Azure、DeepSeek 等），但部分高级功能（如 Conversations API 持久化）只在 OpenAI 自家可用。

Q：AgentKit 和扣子 / Dify 怎么选？ A：和 OpenAI 生态深度绑定 → AgentKit；国内用户、要私有部署、要中文支持最佳 → 扣子 / Dify；两者都试过的团队不少同时用——AgentKit 处理海外 GPT-5 业务，Dify 处理国内私有部署业务。

Q：导出的代码能跑在自家服务器上吗？ A：能。这是 AgentKit 最大的优势之一——你可以「在 OpenAI 云上设计 → 导出代码 → 部署到 AWS/GCP/阿里云」，不被锁死。

Q：AgentKit 现在稳定吗，可以生产用了吗？ A：截至 2026 年 5 月，Agent Builder 和 ChatKit 已经 GA（正式发布），Evals 部分功能仍在迭代。生产用要做好版本锁定 + 充分测试，重要业务不要直接跟最新 beta。