ChatGPT Agent 怎么用?让 AI 自己点鼠标订机票
ChatGPT Agent 怎么用:手把手开启 Agent 模式,让 AI 自己开浏览器、点按钮、跑终端、订机票、改表格,一篇讲清能干什么、不能干什么、怎么避开授权陷阱。
ChatGPT Agent 怎么用,2026 年这个问题终于不再是「等灰度」的状态——OpenAI 把它从 feature flag 推成了 Pro、Plus、Team 用户的默认能力。简单说,Agent 模式就是给 ChatGPT 装了一台属于它自己的电脑:有浏览器、有终端、有文件系统,你下达任务,它真的会去打开网页、点按钮、填表单、下载文件、跑命令,最后把结果交给你。
这篇手把手讲清楚 ChatGPT Agent 是什么、怎么开、第一个任务怎么跑、5 个真实场景能干什么、以及最容易踩的 4 个坑。
30 秒了解 ChatGPT Agent
ChatGPT Agent 是一个让 ChatGPT 在虚拟电脑上替你操作的模式。 它能开浏览器看网页、点按钮、填表单、跑终端命令、下载文件,然后把结果整理给你。
它和 Deep Research 最大的区别:Deep Research 只「读」——读海量网页给你写报告;Agent 既能读也能「写」,能真的点提交按钮、能真的把表格存到云端、能真的发那封邮件(在你点同意之后)。
适合谁用:
- 想让 AI 替自己完成跨网站、跨工具的连贯任务的人(订行程、跑竞品调研、批量整理资料)
- 已经习惯用 ChatGPT 做信息工作、希望再省一截手动操作时间的人
- 对 ChatGPT Tasks 这种定时任务玩腻了、想往「真自动化」走一步的人
不适合谁:要求 100% 不出错的关键任务(涉及付款、合同、对外发送的邮件),它会请求授权但仍可能误点;建议老老实实自己来。
准备工作
开始前先确认这几件事,少走弯路:
- 账号要 Plus、Pro 或 Team。免费账号目前还看不到 Agent 入口。怎么订阅看 ChatGPT Plus 值不值得。
- 平台支持:Web 网页版、macOS 桌面端体验最完整;iOS、Android 也能用,但虚拟桌面在小屏上看起来挤。
- 国内用户:ChatGPT 在中国大陆不开放服务,得自己解决网络与支付。不想折腾的话,可看国产 AI 大全里类似方向的智能体,扣子和 Manus 这类国内 Agent 平台思路相近。
- 预留时间:Agent 跑一个任务通常 3-20 分钟,别在它干活的时候关掉标签页。
详细操作步骤
第 1 步:在对话框里调出 Agent 模式
打开 ChatGPT,在输入框左边点 + 号,下拉菜单里选 Agent mode。或者更快——直接在输入框里敲 /agent,回车确认。
[此处放截图:ChatGPT 输入框 + 号展开菜单,红框标注 Agent mode 选项]
看不到 Agent mode?两种可能:1)你不是 Plus/Pro/Team;2)灰度还没到你账号上。等 1-2 天再看,或者切到 Web 端试试。
第 2 步:把任务说清楚
进入 Agent 模式之后,对话框上方会出现一个「Agent」标识。你直接用人话描述要完成的任务,关键是把 3 件事说清楚:要达成的目标、必须遵守的约束、最终交付物是什么。
例子:
帮我在去哪儿网搜下周一从上海到北京的机票,找出早上 9 点之前起飞、价格最低的 3 个航班,整理成表格给我。
Agent 会先生成一个执行计划,类似「我会先打开去哪儿网首页 → 输入出发到达城市 → 选择日期 → 筛选时段 → 比对价格」。你可以点 Approve 让它开干,也可以打断、修改计划。
第 3 步:边看边监督
任务跑起来之后,界面会分成两边:左边是对话流,右边是 Agent 的「虚拟桌面」。你能实时看到它打开了哪个网页、鼠标点到了哪里、终端输出了什么。
[此处放截图:Agent 运行界面,左侧对话流右侧虚拟桌面浏览器]
想看具体逻辑?把右边切到 Activity 视图,能看到每一步的推理过程,类似 Deep Research 的思考链。
第 4 步:在敏感动作出现时主动介入
Agent 默认会在做以下动作前停下来请求授权:
- 发送邮件、提交表单、付款
- 填写登录账号密码(这一步它根本不会偷看你输入的内容,桌面会自动模糊)
- 下载大文件、安装插件
- 修改云端文件(如 Google Drive、Notion)
弹出授权时认真读一眼描述,确认要做的事再点 Allow。犹豫就拒——拒绝后你可以接管浏览器,自己点完那一步再让 Agent 继续。
第 5 步:让 Agent 接住交付物
任务完成后,Agent 会把结果以下面几种形式之一交给你:
- 对话内 Markdown 总结:最常见,方便复制
- 可下载的文件:CSV、PDF、Word、PNG
- Canvas 画布:长文本和代码会落到 Canvas 里方便后续编辑(见 ChatGPT Canvas 怎么用)
[此处放截图:Agent 任务完成后的交付物界面,含下载按钮]
不满意?直接在对话里说「重新做第 3 步,把价格筛选条件改成 800 元以内」,它会从你指定的步骤接着跑,不必从头来过。
第 6 步:复盘和复用
每次 Agent 跑完,对话会自动保存在左侧列表里。好用的任务记得给它起个清晰的对话名,下次直接进去说「按上次的方式再跑一次,把日期换成下周二」就行,省一截描述时间。
5 个 ChatGPT Agent 真实可用场景
第一个任务跑通之后,下面这 5 个场景能真正帮你省时间。
1. 跨网站资料汇总
让 Agent 去 5 个竞品官网各抓一遍最新产品页 + 价格 + 主打功能,然后拼成一张对比表。以前一个人做要 1-2 小时,Agent 大概 8-15 分钟跑完。
2. 复杂订票订房
「下周三飞东京、住新宿、预算 800/晚、含早餐、有健身房,给我 3 个备选」——这类带多个约束的搜索 Agent 比人快,因为它能并行打开多个网站对比。
3. 简单数据处理
让它打开你云端的某个 Google Sheet,把 A 列里所有「待跟进」状态的行复制到新 sheet 并按日期排序。需要先连接 Google Drive。
4. 资料整理与归档
「这是 20 张发票图片,按月份分类、命名、汇总金额,导出 Excel」——Agent 在终端里跑 Python 就能搞定,过去这种事得自己开 Jupyter。
5. 信息监控类巡检
每周一让 Agent 跑一次「我的 5 家关注公司 GitHub 仓库本周新 release」,配合 ChatGPT Tasks 还能定时触发。
常见坑 + 解决办法
| 现象 | 原因 | 解决 |
|---|---|---|
| 找不到 Agent mode 入口 | 灰度未到 / 账号是 Free | 等 1-2 天;升级 Plus 以上 |
| 任务跑到一半卡住 | 网页加载超时 / 弹出验证码 | 点 Take over 自己过验证码再让它继续 |
| 在登录页前停住反复要密码 | Agent 不会保存账号 | 自己接管登录,登录后还给它 |
| 跑完结果不对 | 描述太模糊 / 网页改版 | 把目标、约束、交付物写得更具体;换二级网站重试 |
| 授权弹窗一闪而过 | Agent 自动确认开了 | 在设置里关掉「Auto-approve safe actions」 |
| 跑了很久也不出结果 | 任务超出能力(如视频生成) | 拆成更小任务;该用专用工具的别硬塞给 Agent |
| 跨网站登录失败 | Cookies 未保存 | 同一会话里跑完任务别关;下次重新登 |
实战案例:一个真能用的 Agent prompt
下面这个 prompt 已经在我自己账号上跑成功过 3 次。目标是自动整理本周 AI 行业大事,跑一次大概 12-18 分钟。
把对话切到 Agent mode,复制粘贴这段:
请帮我做一份本周 AI 行业大事汇总。
任务要求:
- 打开 TechCrunch、The Verge、Hacker News 这三个站
- 找出过去 7 天里和「AI」「大模型」「OpenAI」「Anthropic」「Google DeepMind」「Meta AI」相关的报道
- 每个站挑出阅读量或讨论量最高的 3 条,共 9 条
- 每条用中文写 50 字以内的摘要,附原文链接
- 最后用一张表格汇总:标题、来源、日期、链接、一句话点评
- 整理成 Markdown,直接放到对话里
约束:
- 不要进收费墙后面的文章
- 中文摘要要客观,不要堆形容词
- 如果某站当天打不开,跳过并在末尾注明
执行前请先把计划告诉我,我确认后再开始。
发送之后 Agent 会先输出执行计划,确认无误点 Approve。期间它会切换浏览器、滚动页面、点入文章——你能全程看到。第一次跑务必盯着前 2-3 分钟,确认浏览方向对了再去做别的事。
跑通这个之后,你大概率会对接下来的两个高阶玩法上瘾。
进阶 prompt:让 Agent 做你的「周报数据搬运工」
下面这个稍微复杂一点,适合已经把上面的晨报跑顺、想让 Agent 把数据搬到自己工具里的人。
请帮我做一项周报准备工作。
任务:
- 打开我连接的 Google Drive,进入「2026 周报」文件夹
- 找到「本周数据源.xlsx」这个文件,下载
- 读出其中「销售」sheet 的 A、B、E 三列(产品名 / 销量 / 客户名)
- 按客户名分组求和销量,按销量降序排
- 用 Python 在终端里把结果画成一张柱状图(matplotlib 即可)
- 把图保存为 PNG,连同前 10 名的明细表格一起放到对话里
- 顺手在对话里给我写一段 200 字的「本周销售口述稿」,重点是 Top 3 客户和环比变化
约束:
- 数字要从表格直接读,不要估算
- 客户名如果有英文写法保留英文
- 写口述稿要像人话,别用「值得注意的是」这种官腔
请先告诉我你打算怎么做,等我点 Approve 再开始。
这个任务对 Agent 的「读表 + 算数 + 画图」能力是个综合考验,跑通一次基本能定型,每周复用只换数据源文件名就行。
安全须知:Agent 不是无脑放手的工具
Agent 强是真强,但有几条底线必须守,省得出事:
- 不要让它直接付款:哪怕你信任它,让它走到付款页就主动接管,自己输卡号。
- 不要让它代发对外邮件:让它起草,你自己点发送。代发出错的政治后果通常比省的那点时间贵得多。
- 重要账号开二步验证:万一 Agent 误操作,2FA 是最后一道防线。
- 跑完看一遍 Activity 时间线:Agent 偶尔会自作主张走捷径,看时间线能发现哪一步偏离了。
下一步:把 Agent 串进你的 AI 工作流
Agent 是 ChatGPT 从「问答工具」走向「真助理」的拐点。如果你想把它和其他能力组合起来,下面几个方向值得继续看:
- 想让 AI 定时主动给你推送 → ChatGPT Tasks 怎么用
- 想让 AI 替你写深度调研报告 → ChatGPT Deep Research 怎么用
- 想把对话沉到知识库里反复用 → ChatGPT Projects 怎么用
- 想知道 ChatGPT vs Claude 在 Agent 上谁更强 → ChatGPT vs Claude
- 想从零了解 AI Agent 这一整个赛道 → AI Agent 教程入口
一句实话:Agent 现在还会犯错,但它是你能用最低成本体验「AI 替你做事」的入口,先用起来,半年后你会感谢现在的自己。