🤖 AI 跟我学 新手入门

Agent 工作流是什么?从触发到执行全过程

Agent 工作流(Agent Workflow)是什么?这篇用人话讲清楚 AI Agent 从触发、规划、调工具、执行到交付的全过程,含 OpenAI AgentKit 真实例子

发布 2026/05/18 📎 参考官方文档

一句话说清 Agent 工作流是什么

Agent 工作流(Agent Workflow)就是把「AI Agent 接到一个目标后,从触发到交付结果」这一整套过程画成一条流水线,每一步谁干什么、用什么工具、上一步的结果给下一步用什么,都规规矩矩定好。

如果说 Agent 是「会自己干活的 AI 程序」,那 Agent 工作流就是这个程序的「工作流程图」。OpenAI 在 2025 年发布的 AgentKit 平台就把这个流程图变成了一个可视化的拖拽工具,零代码就能搭出一个能跑的 Agent 工作流。

简单记:Agent 是干活的人,Agent 工作流是给这个人写的「岗位说明书 + SOP」

用一个生活场景理解

假设你开了一家小型留学咨询公司,新来了一个实习生。你不会上来就说”你看着办吧”——你会给他一份岗位 SOP:

  1. 客户在网站上填表 → 触发流程
  2. 实习生先看简历是否完整 → 信息抽取
  3. 对比客户的目标院校要求 → 差距分析
  4. 给客户推荐 3 门课程 + 1 个考试 → 输出建议
  5. 把建议发到客户邮箱 → 交付

这份 SOP 就是工作流。换成 AI Agent 版本,5 个步骤可能是 5 个不同的小 Agent 接力,也可能是 1 个 Agent 调 5 个工具——但流程框架是一样的。

Agent 工作流的意义就是:让 AI 干活也有「岗位说明书」可循,不靠它即兴发挥

Agent 工作流的 5 个关键阶段

任何一个 Agent 工作流,不管简单复杂,都能拆成这 5 个阶段。理解了它们,你看任何 Agent 系统都不会再懵。

1. 触发(Trigger)

谁来启动这个工作流?常见触发器:

  • 用户主动输入:用户在聊天框打字 / 上传文件 / 点按钮
  • 定时触发:每天早 9 点自动跑一次(如日报 Agent)
  • 事件触发:邮箱收到新邮件 / GitHub 有新 PR / 监控系统报警
  • 其他 Agent 调用:上一个 Agent 把任务交接过来

OpenAI AgentKit 的简历分析例子里,触发条件就是「用户上传简历并填写目标岗位」。

2. 规划(Planning)

Agent 拿到目标后,先想清楚「为了完成这件事,我要分几步做」。

  • 简单工作流:步骤是工程师预先定好的(如「先抽取 → 再分析 → 再推荐」)
  • 复杂工作流:Agent 自己根据目标动态拆步骤

新手建议先用「预先定好」的固定流程,跑稳了再尝试动态规划。固定流程更可控、好调试、好优化。

3. 调工具(Tool Use)

每一步要干的事,Agent 自己决定调哪个工具:

  • 信息抽取这一步 → 调用「PDF 解析」工具
  • 网上找资料这一步 → 调用「Web Search」工具
  • 写邮件这一步 → 调用「邮件发送」工具

工具的选择规则在 Agent 的指令(system prompt)里说清楚。比如:「需要查最新信息时,必须用 Web Search 工具」。

4. 执行 + 观察(Act + Observe)

工具调用完,Agent 看结果。这一步通常会判断:

  • 结果对不对?需要不需要重新调一次?
  • 信息够不够?要不要再调别的工具补充?
  • 下一步该干啥?

「调用 → 看结果 → 决策下一步」这个小循环跑完一遍叫一个 step。一个完整工作流通常 3-20 个 step。

5. 交付(Deliver)

所有步骤跑完,Agent 把最终结果按预定格式交给用户。

  • 文字结果:直接回复在聊天框
  • 文档:生成 PDF / Word / Excel
  • 通知:发邮件 / 发钉钉 / 发微信
  • 操作:直接在系统里改数据 / 下单 / 发货

好的工作流会在「交付前」加一道审核——重要决策、不可逆操作必须先等用户确认,而不是闷头执行。

OpenAI AgentKit 工作流真实案例

AgentKit 是 OpenAI 2025 年推出的可视化 Agent 工作流平台。官方文档里展示了一个「职业发展助手」工作流,刚好把 5 个阶段全用上了:

用户场景:求职者上传简历 + 输入梦想职位,希望得到「我离目标有什么差距、该补什么课程」的建议。

工作流设计

  1. 触发 — 用户上传 PDF 简历,在表单填写目标岗位
  2. 简历提取 Agent — 把 PDF 解析成结构化的 JSON(技能、经验、教育)
  3. 职业分析 Agent — 拿提取出的技能对比目标岗位要求,找出差距清单
  4. 课程推荐 Agent — 调用 Web Search 工具,在真实在线教育平台找匹配的课程
  5. 交付 — 把「差距分析 + 课程推荐 + 学习路径」打包成报告给用户

3 个 Agent 之间用「双花括号包变量名」的语法传递上一步的输出(例如把上一节点的输出用 \{\{output\}\} 引用)。这就是典型的接力式工作流(Handoff Pattern),适合「步骤清晰、上下游耦合明确」的场景。

AgentKit 的 3 大组件

如果你想自己搭 Agent 工作流,AgentKit 这套工具值得了解:

1. Agent Builder(可视化编辑器)

像 Figma 一样的画布,用节点拖拽搭工作流。每个节点是一个 Agent / 工具 / 判断逻辑,节点之间用线连起来表示数据流向。

非工程师也能搭,特别适合产品/运营快速验证想法。

2. ChatKit(前端集成组件)

工作流搭完了想让用户用,就需要前端。ChatKit 是 OpenAI 官方提供的 Web 组件,几行代码就能把你的 Agent 工作流嵌进任何网站,自带主题定制和富交互卡片。

省去自己写聊天 UI 的力气。

3. Evals(评估与优化)

最容易被忽略但最重要的部分。Evals 帮你:

  • 跑测试集看工作流准确率
  • 追踪每一步的 trace(Agent 想了啥、调了啥工具、返回啥)
  • 自动优化 prompt(让 AI 帮你改 system prompt 提升效果)

没有 Evals 的 Agent 就是上线后乱开炮。这一步是把玩具升级成生产系统的关键。

一个帮你设计自己 Agent 工作流的 prompt

打算自己搭一个 Agent 工作流,又不知道怎么拆?用下面这个 prompt 让 AI 帮你画初稿:

📋 Prompt 模板

你是一位资深 AI Agent 工作流架构师。我会描述一个想自动化的业务场景,请你帮我设计一个完整的 Agent 工作流,包含以下 5 个阶段:

  1. 触发(什么事件启动这个流程)
  2. 规划(拆成几步,每一步目标是什么)
  3. 工具(每一步需要调用什么工具或外部能力)
  4. 执行与观察(如何判断这一步成功、失败要怎么处理)
  5. 交付(最终给用户什么形式的结果)

格式要求:

  • 用编号列表列出每个 Agent / 步骤
  • 每个 Agent 标注「输入 → 处理 → 输出」
  • 最后给一句话总结这个工作流为什么这样设计
  • 如果某一步可以用单一 Agent 完成,就不要为了凑数拆成多个

我的业务场景是:[这里描述你的场景,越具体越好]

把方括号里换成你的实际场景,扔给 ChatGPT / Claude 都能得到一份不错的初稿。

Agent 工作流 vs 传统自动化(如 Zapier)

很多人会问:Agent 工作流和我用了 5 年的 Zapier / 集简云有啥区别?一张表对比:

维度传统自动化(Zapier 等)Agent 工作流
流程逻辑固定 if-then 规则LLM 自己根据情况判断
处理非结构化数据弱(依赖人工预定义字段)强(直接理解自然语言)
异常处理报错就停Agent 自己尝试换路径
配置门槛中(要懂 API 和触发器)低(说人话也能配)
成本按任务次数订阅按 token 消耗付费
适合场景数据搬运、定时任务复杂判断、多源信息综合

简单记:流程死板、规则明确 → Zapier;流程灵活、要 AI 判断 → Agent 工作流。两者经常配合用:Zapier 负责前后端数据搬运,Agent 工作流嵌在中间做「思考」环节。

Agent 工作流的 3 个常见坑

坑 1:流程画得太复杂,没人能维护

一兴奋就把 20 个节点连起来,结果出问题没人能跟着流程图找到原因。经验值:单个工作流最多 8-10 个节点。超过就拆成子工作流(一个 Agent 调另一个 Agent)。

坑 2:每一步都用顶配模型

简单的字段抽取也用 GPT-5,结果一次工作流跑下来花 2 美元。最佳实践是按步骤难度配模型

  • 简单分类、抽取 → 用便宜模型(gpt-4o-mini、DeepSeek-V3)
  • 关键决策、综合判断 → 用顶配模型(GPT-5、Claude Opus 4.7)

坑 3:上线没做 Evals

测试时跑得欢,上线一周准确率掉到 60%。原因是真实用户的输入比你想象的杂乱多了。任何工作流上线前都要有评估集:手动准备 30-50 条真实用户输入 + 期望输出,每次改 prompt 就跑一遍,看准确率有没有掉。

国内能用 Agent 工作流吗?

完全能用,国产平台甚至比国外更易上手。

国产可视化平台(推荐入门):

  • 扣子 Coze:字节跳动出品,可视化拖拽工作流,免费版功能够用
  • Dify:开源 + 私有部署,企业级首选
  • 百度千帆 AppBuilder:百度生态,To B 友好
  • 阿里通义灵码 Agent:阿里出品,适合代码 Agent 场景

海外开发者工具(需科学上网):

  • OpenAI AgentKit:本文主角,可视化 + SDK 双路径
  • LangGraph:业界标杆的代码框架
  • n8n:开源版的 Zapier,支持接 LLM

详细对比看 国产 AI Agent 平台盘点

下一步

读完这篇你已经知道 Agent 工作流是啥、5 个阶段是什么、和传统自动化啥区别。接着值得看的:

常见问题

Q:Agent 工作流和 LangChain 啥关系? A:LangChain 是一个写 Agent 工作流的代码库,Agent 工作流是个概念。你可以用 LangChain / LangGraph 写工作流,也可以用 OpenAI AgentKit、扣子这种可视化工具搭,不冲突。

Q:Agent 工作流必须用多 Agent 吗? A:不必须。单 Agent + 多工具也能跑完整工作流,简单场景这样反而更快。多 Agent 适合「步骤之间逻辑差很大、上下文要分离」的场景。

Q:完全不会写代码能搭工作流吗? A:能。扣子 Coze、Dify、AgentKit 都支持纯可视化拖拽,会写 prompt 就够了。复杂业务再考虑写代码。

Q:工作流跑一次大概多少钱? A:看模型和步骤数。用便宜模型跑 5 步简单工作流大概 0.001-0.01 美元;用顶配模型跑 20 步复杂工作流可能 0.5-2 美元。务必算清楚单次成本再上线。

Q:工作流跑失败怎么办? A:好的工作流必须有失败处理:1)每一步设重试上限;2)关键步骤失败转人工;3)记录完整 trace 方便事后排查。这些在 AgentKit / LangGraph 都有内置机制。

Q:Agent 工作流安全吗? A:协议安全,用不对很危险。三条铁律:1)涉及钱、删数据的操作必须人工确认;2)外部输入要做安全过滤;3)生产环境一定要有日志和告警。