Agent 工作流是什么？从触发到执行全过程

一句话说清 Agent 工作流是什么

Agent 工作流（Agent Workflow）就是把「AI Agent 接到一个目标后，从触发到交付结果」这一整套过程画成一条流水线，每一步谁干什么、用什么工具、上一步的结果给下一步用什么，都规规矩矩定好。

如果说 Agent 是「会自己干活的 AI 程序」，那 Agent 工作流就是这个程序的「工作流程图」。OpenAI 在 2025 年发布的 AgentKit 平台就把这个流程图变成了一个可视化的拖拽工具，零代码就能搭出一个能跑的 Agent 工作流。

简单记：Agent 是干活的人，Agent 工作流是给这个人写的「岗位说明书 + SOP」。

用一个生活场景理解

假设你开了一家小型留学咨询公司，新来了一个实习生。你不会上来就说”你看着办吧”——你会给他一份岗位 SOP：

客户在网站上填表 → 触发流程
实习生先看简历是否完整 → 信息抽取
对比客户的目标院校要求 → 差距分析
给客户推荐 3 门课程 + 1 个考试 → 输出建议
把建议发到客户邮箱 → 交付

这份 SOP 就是工作流。换成 AI Agent 版本，5 个步骤可能是 5 个不同的小 Agent 接力，也可能是 1 个 Agent 调 5 个工具——但流程框架是一样的。

Agent 工作流的意义就是：让 AI 干活也有「岗位说明书」可循，不靠它即兴发挥。

Agent 工作流的 5 个关键阶段

任何一个 Agent 工作流，不管简单复杂，都能拆成这 5 个阶段。理解了它们，你看任何 Agent 系统都不会再懵。

1. 触发（Trigger）

谁来启动这个工作流？常见触发器：

用户主动输入：用户在聊天框打字 / 上传文件 / 点按钮
定时触发：每天早 9 点自动跑一次（如日报 Agent）
事件触发：邮箱收到新邮件 / GitHub 有新 PR / 监控系统报警
其他 Agent 调用：上一个 Agent 把任务交接过来

OpenAI AgentKit 的简历分析例子里，触发条件就是「用户上传简历并填写目标岗位」。

2. 规划（Planning）

Agent 拿到目标后，先想清楚「为了完成这件事，我要分几步做」。

简单工作流：步骤是工程师预先定好的（如「先抽取 → 再分析 → 再推荐」）
复杂工作流：Agent 自己根据目标动态拆步骤

新手建议先用「预先定好」的固定流程，跑稳了再尝试动态规划。固定流程更可控、好调试、好优化。

3. 调工具（Tool Use）

每一步要干的事，Agent 自己决定调哪个工具：

信息抽取这一步 → 调用「PDF 解析」工具
网上找资料这一步 → 调用「Web Search」工具
写邮件这一步 → 调用「邮件发送」工具

工具的选择规则在 Agent 的指令（system prompt）里说清楚。比如：「需要查最新信息时，必须用 Web Search 工具」。

4. 执行 + 观察（Act + Observe）

工具调用完，Agent 看结果。这一步通常会判断：

结果对不对？需要不需要重新调一次？
信息够不够？要不要再调别的工具补充？
下一步该干啥？

「调用 → 看结果 → 决策下一步」这个小循环跑完一遍叫一个 step。一个完整工作流通常 3-20 个 step。

5. 交付（Deliver）

所有步骤跑完，Agent 把最终结果按预定格式交给用户。

文字结果：直接回复在聊天框
文档：生成 PDF / Word / Excel
通知：发邮件 / 发钉钉 / 发微信
操作：直接在系统里改数据 / 下单 / 发货

好的工作流会在「交付前」加一道审核——重要决策、不可逆操作必须先等用户确认，而不是闷头执行。

OpenAI AgentKit 工作流真实案例

AgentKit 是 OpenAI 2025 年推出的可视化 Agent 工作流平台。官方文档里展示了一个「职业发展助手」工作流，刚好把 5 个阶段全用上了：

用户场景：求职者上传简历 + 输入梦想职位，希望得到「我离目标有什么差距、该补什么课程」的建议。

工作流设计：

触发 — 用户上传 PDF 简历，在表单填写目标岗位
简历提取 Agent — 把 PDF 解析成结构化的 JSON（技能、经验、教育）
职业分析 Agent — 拿提取出的技能对比目标岗位要求，找出差距清单
课程推荐 Agent — 调用 Web Search 工具，在真实在线教育平台找匹配的课程
交付 — 把「差距分析 + 课程推荐 + 学习路径」打包成报告给用户

3 个 Agent 之间用「双花括号包变量名」的语法传递上一步的输出（例如把上一节点的输出用 \{\{output\}\} 引用）。这就是典型的接力式工作流（Handoff Pattern），适合「步骤清晰、上下游耦合明确」的场景。

AgentKit 的 3 大组件

如果你想自己搭 Agent 工作流，AgentKit 这套工具值得了解：

1. Agent Builder（可视化编辑器）

像 Figma 一样的画布，用节点拖拽搭工作流。每个节点是一个 Agent / 工具 / 判断逻辑，节点之间用线连起来表示数据流向。

非工程师也能搭，特别适合产品/运营快速验证想法。

2. ChatKit（前端集成组件）

工作流搭完了想让用户用，就需要前端。ChatKit 是 OpenAI 官方提供的 Web 组件，几行代码就能把你的 Agent 工作流嵌进任何网站，自带主题定制和富交互卡片。

省去自己写聊天 UI 的力气。

3. Evals（评估与优化）

最容易被忽略但最重要的部分。Evals 帮你：

跑测试集看工作流准确率
追踪每一步的 trace（Agent 想了啥、调了啥工具、返回啥）
自动优化 prompt（让 AI 帮你改 system prompt 提升效果）

没有 Evals 的 Agent 就是上线后乱开炮。这一步是把玩具升级成生产系统的关键。

一个帮你设计自己 Agent 工作流的 prompt

打算自己搭一个 Agent 工作流，又不知道怎么拆？用下面这个 prompt 让 AI 帮你画初稿：

📋 Prompt 模板

你是一位资深 AI Agent 工作流架构师。我会描述一个想自动化的业务场景，请你帮我设计一个完整的 Agent 工作流，包含以下 5 个阶段：

触发（什么事件启动这个流程）
规划（拆成几步，每一步目标是什么）
工具（每一步需要调用什么工具或外部能力）
执行与观察（如何判断这一步成功、失败要怎么处理）
交付（最终给用户什么形式的结果）

格式要求：

用编号列表列出每个 Agent / 步骤
每个 Agent 标注「输入 → 处理 → 输出」
最后给一句话总结这个工作流为什么这样设计
如果某一步可以用单一 Agent 完成，就不要为了凑数拆成多个

我的业务场景是：[这里描述你的场景，越具体越好]

把方括号里换成你的实际场景，扔给 ChatGPT / Claude 都能得到一份不错的初稿。

Agent 工作流 vs 传统自动化（如 Zapier）

很多人会问：Agent 工作流和我用了 5 年的 Zapier / 集简云有啥区别？一张表对比：

维度	传统自动化（Zapier 等）	Agent 工作流
流程逻辑	固定 if-then 规则	LLM 自己根据情况判断
处理非结构化数据	弱（依赖人工预定义字段）	强（直接理解自然语言）
异常处理	报错就停	Agent 自己尝试换路径
配置门槛	中（要懂 API 和触发器）	低（说人话也能配）
成本	按任务次数订阅	按 token 消耗付费
适合场景	数据搬运、定时任务	复杂判断、多源信息综合

简单记：流程死板、规则明确 → Zapier；流程灵活、要 AI 判断 → Agent 工作流。两者经常配合用：Zapier 负责前后端数据搬运，Agent 工作流嵌在中间做「思考」环节。

Agent 工作流的 3 个常见坑

坑 1：流程画得太复杂，没人能维护

一兴奋就把 20 个节点连起来，结果出问题没人能跟着流程图找到原因。经验值：单个工作流最多 8-10 个节点。超过就拆成子工作流（一个 Agent 调另一个 Agent）。

坑 2：每一步都用顶配模型

简单的字段抽取也用 GPT-5，结果一次工作流跑下来花 2 美元。最佳实践是按步骤难度配模型：

简单分类、抽取 → 用便宜模型（gpt-4o-mini、DeepSeek-V3）
关键决策、综合判断 → 用顶配模型（GPT-5、Claude Opus 4.7）

坑 3：上线没做 Evals

测试时跑得欢，上线一周准确率掉到 60%。原因是真实用户的输入比你想象的杂乱多了。任何工作流上线前都要有评估集：手动准备 30-50 条真实用户输入 + 期望输出，每次改 prompt 就跑一遍，看准确率有没有掉。

国内能用 Agent 工作流吗？

完全能用，国产平台甚至比国外更易上手。

国产可视化平台（推荐入门）：

扣子 Coze：字节跳动出品，可视化拖拽工作流，免费版功能够用
Dify：开源 + 私有部署，企业级首选
百度千帆 AppBuilder：百度生态，To B 友好
阿里通义灵码 Agent：阿里出品，适合代码 Agent 场景

海外开发者工具（需科学上网）：

OpenAI AgentKit：本文主角，可视化 + SDK 双路径
LangGraph：业界标杆的代码框架
n8n：开源版的 Zapier，支持接 LLM

详细对比看国产 AI Agent 平台盘点。

下一步

读完这篇你已经知道 Agent 工作流是啥、5 个阶段是什么、和传统自动化啥区别。接着值得看的：

AI Agent 是什么？1 篇看懂智能体的 5 大组件：理解工作流的执行主体
多智能体协作是什么？1 篇讲透 Multi-Agent：多 Agent 怎么协作
Function Calling 是什么？AI 调外部工具的原理：工作流里调工具的底层机制
扣子 Coze 怎么用？保姆级教程：用国产平台搭你的第一个工作流
AI 智能体完全指南：Pillar 长文

常见问题

Q：Agent 工作流和 LangChain 啥关系？ A：LangChain 是一个写 Agent 工作流的代码库，Agent 工作流是个概念。你可以用 LangChain / LangGraph 写工作流，也可以用 OpenAI AgentKit、扣子这种可视化工具搭，不冲突。

Q：Agent 工作流必须用多 Agent 吗？ A：不必须。单 Agent + 多工具也能跑完整工作流，简单场景这样反而更快。多 Agent 适合「步骤之间逻辑差很大、上下文要分离」的场景。

Q：完全不会写代码能搭工作流吗？ A：能。扣子 Coze、Dify、AgentKit 都支持纯可视化拖拽，会写 prompt 就够了。复杂业务再考虑写代码。

Q：工作流跑一次大概多少钱？ A：看模型和步骤数。用便宜模型跑 5 步简单工作流大概 0.001-0.01 美元；用顶配模型跑 20 步复杂工作流可能 0.5-2 美元。务必算清楚单次成本再上线。

Q：工作流跑失败怎么办？ A：好的工作流必须有失败处理：1）每一步设重试上限；2）关键步骤失败转人工；3）记录完整 trace 方便事后排查。这些在 AgentKit / LangGraph 都有内置机制。

Q：Agent 工作流安全吗？ A：协议安全，用不对很危险。三条铁律：1）涉及钱、删数据的操作必须人工确认；2）外部输入要做安全过滤；3）生产环境一定要有日志和告警。