ChatGPT Agent 怎么用？让 AI 自己点鼠标订机票

ChatGPT Agent 怎么用，2026 年这个问题终于不再是「等灰度」的状态——OpenAI 把它从 feature flag 推成了 Pro、Plus、Team 用户的默认能力。简单说，Agent 模式就是给 ChatGPT 装了一台属于它自己的电脑：有浏览器、有终端、有文件系统，你下达任务，它真的会去打开网页、点按钮、填表单、下载文件、跑命令，最后把结果交给你。

这篇手把手讲清楚 ChatGPT Agent 是什么、怎么开、第一个任务怎么跑、5 个真实场景能干什么、以及最容易踩的 4 个坑。

30 秒了解 ChatGPT Agent

ChatGPT Agent 是一个让 ChatGPT 在虚拟电脑上替你操作的模式。 它能开浏览器看网页、点按钮、填表单、跑终端命令、下载文件，然后把结果整理给你。

它和 Deep Research 最大的区别：Deep Research 只「读」——读海量网页给你写报告；Agent 既能读也能「写」，能真的点提交按钮、能真的把表格存到云端、能真的发那封邮件（在你点同意之后）。

适合谁用：

想让 AI 替自己完成跨网站、跨工具的连贯任务的人（订行程、跑竞品调研、批量整理资料）
已经习惯用 ChatGPT 做信息工作、希望再省一截手动操作时间的人
对 ChatGPT Tasks 这种定时任务玩腻了、想往「真自动化」走一步的人

不适合谁：要求 100% 不出错的关键任务（涉及付款、合同、对外发送的邮件），它会请求授权但仍可能误点；建议老老实实自己来。

准备工作

开始前先确认这几件事，少走弯路：

账号要 Plus、Pro 或 Team。免费账号目前还看不到 Agent 入口。怎么订阅看 ChatGPT Plus 值不值得。
平台支持：Web 网页版、macOS 桌面端体验最完整；iOS、Android 也能用，但虚拟桌面在小屏上看起来挤。
国内用户：ChatGPT 在中国大陆不开放服务，得自己解决网络与支付。不想折腾的话，可看国产 AI 大全里类似方向的智能体，扣子和 Manus 这类国内 Agent 平台思路相近。
预留时间：Agent 跑一个任务通常 3-20 分钟，别在它干活的时候关掉标签页。

详细操作步骤

第 1 步：在对话框里调出 Agent 模式

打开 ChatGPT，在输入框左边点 + 号，下拉菜单里选 Agent mode。或者更快——直接在输入框里敲 /agent，回车确认。

[此处放截图：ChatGPT 输入框 + 号展开菜单，红框标注 Agent mode 选项]

看不到 Agent mode？两种可能：1）你不是 Plus/Pro/Team；2）灰度还没到你账号上。等 1-2 天再看，或者切到 Web 端试试。

第 2 步：把任务说清楚

进入 Agent 模式之后，对话框上方会出现一个「Agent」标识。你直接用人话描述要完成的任务，关键是把 3 件事说清楚：要达成的目标、必须遵守的约束、最终交付物是什么。

例子：

帮我在去哪儿网搜下周一从上海到北京的机票，找出早上 9 点之前起飞、价格最低的 3 个航班，整理成表格给我。

Agent 会先生成一个执行计划，类似「我会先打开去哪儿网首页 → 输入出发到达城市 → 选择日期 → 筛选时段 → 比对价格」。你可以点 Approve 让它开干，也可以打断、修改计划。

第 3 步：边看边监督

任务跑起来之后，界面会分成两边：左边是对话流，右边是 Agent 的「虚拟桌面」。你能实时看到它打开了哪个网页、鼠标点到了哪里、终端输出了什么。

[此处放截图：Agent 运行界面，左侧对话流右侧虚拟桌面浏览器]

想看具体逻辑？把右边切到 Activity 视图，能看到每一步的推理过程，类似 Deep Research 的思考链。

第 4 步：在敏感动作出现时主动介入

Agent 默认会在做以下动作前停下来请求授权：

发送邮件、提交表单、付款
填写登录账号密码（这一步它根本不会偷看你输入的内容，桌面会自动模糊）
下载大文件、安装插件
修改云端文件（如 Google Drive、Notion）

弹出授权时认真读一眼描述，确认要做的事再点 Allow。犹豫就拒——拒绝后你可以接管浏览器，自己点完那一步再让 Agent 继续。

第 5 步：让 Agent 接住交付物

任务完成后，Agent 会把结果以下面几种形式之一交给你：

对话内 Markdown 总结：最常见，方便复制
可下载的文件：CSV、PDF、Word、PNG
Canvas 画布：长文本和代码会落到 Canvas 里方便后续编辑（见 ChatGPT Canvas 怎么用）

[此处放截图：Agent 任务完成后的交付物界面，含下载按钮]

不满意？直接在对话里说「重新做第 3 步，把价格筛选条件改成 800 元以内」，它会从你指定的步骤接着跑，不必从头来过。

第 6 步：复盘和复用

每次 Agent 跑完，对话会自动保存在左侧列表里。好用的任务记得给它起个清晰的对话名，下次直接进去说「按上次的方式再跑一次，把日期换成下周二」就行，省一截描述时间。

5 个 ChatGPT Agent 真实可用场景

第一个任务跑通之后，下面这 5 个场景能真正帮你省时间。

1. 跨网站资料汇总

让 Agent 去 5 个竞品官网各抓一遍最新产品页 + 价格 + 主打功能，然后拼成一张对比表。以前一个人做要 1-2 小时，Agent 大概 8-15 分钟跑完。

2. 复杂订票订房

「下周三飞东京、住新宿、预算 800/晚、含早餐、有健身房，给我 3 个备选」——这类带多个约束的搜索 Agent 比人快，因为它能并行打开多个网站对比。

3. 简单数据处理

让它打开你云端的某个 Google Sheet，把 A 列里所有「待跟进」状态的行复制到新 sheet 并按日期排序。需要先连接 Google Drive。

4. 资料整理与归档

「这是 20 张发票图片，按月份分类、命名、汇总金额，导出 Excel」——Agent 在终端里跑 Python 就能搞定，过去这种事得自己开 Jupyter。

5. 信息监控类巡检

每周一让 Agent 跑一次「我的 5 家关注公司 GitHub 仓库本周新 release」，配合 ChatGPT Tasks 还能定时触发。

常见坑 + 解决办法

现象	原因	解决
找不到 Agent mode 入口	灰度未到 / 账号是 Free	等 1-2 天；升级 Plus 以上
任务跑到一半卡住	网页加载超时 / 弹出验证码	点 Take over 自己过验证码再让它继续
在登录页前停住反复要密码	Agent 不会保存账号	自己接管登录，登录后还给它
跑完结果不对	描述太模糊 / 网页改版	把目标、约束、交付物写得更具体；换二级网站重试
授权弹窗一闪而过	Agent 自动确认开了	在设置里关掉「Auto-approve safe actions」
跑了很久也不出结果	任务超出能力（如视频生成）	拆成更小任务；该用专用工具的别硬塞给 Agent
跨网站登录失败	Cookies 未保存	同一会话里跑完任务别关；下次重新登

实战案例：一个真能用的 Agent prompt

下面这个 prompt 已经在我自己账号上跑成功过 3 次。目标是自动整理本周 AI 行业大事，跑一次大概 12-18 分钟。

把对话切到 Agent mode，复制粘贴这段：

📋 Prompt 模板

请帮我做一份本周 AI 行业大事汇总。

任务要求：

打开 TechCrunch、The Verge、Hacker News 这三个站
找出过去 7 天里和「AI」「大模型」「OpenAI」「Anthropic」「Google DeepMind」「Meta AI」相关的报道
每个站挑出阅读量或讨论量最高的 3 条，共 9 条
每条用中文写 50 字以内的摘要，附原文链接
最后用一张表格汇总：标题、来源、日期、链接、一句话点评
整理成 Markdown，直接放到对话里

约束：

不要进收费墙后面的文章
中文摘要要客观，不要堆形容词
如果某站当天打不开，跳过并在末尾注明

执行前请先把计划告诉我，我确认后再开始。

发送之后 Agent 会先输出执行计划，确认无误点 Approve。期间它会切换浏览器、滚动页面、点入文章——你能全程看到。第一次跑务必盯着前 2-3 分钟，确认浏览方向对了再去做别的事。

跑通这个之后，你大概率会对接下来的两个高阶玩法上瘾。

进阶 prompt：让 Agent 做你的「周报数据搬运工」

下面这个稍微复杂一点，适合已经把上面的晨报跑顺、想让 Agent 把数据搬到自己工具里的人。

📋 Prompt 模板

请帮我做一项周报准备工作。

任务：

打开我连接的 Google Drive，进入「2026 周报」文件夹
找到「本周数据源.xlsx」这个文件，下载
读出其中「销售」sheet 的 A、B、E 三列（产品名 / 销量 / 客户名）
按客户名分组求和销量，按销量降序排
用 Python 在终端里把结果画成一张柱状图（matplotlib 即可）
把图保存为 PNG，连同前 10 名的明细表格一起放到对话里
顺手在对话里给我写一段 200 字的「本周销售口述稿」，重点是 Top 3 客户和环比变化

约束：

数字要从表格直接读，不要估算
客户名如果有英文写法保留英文
写口述稿要像人话，别用「值得注意的是」这种官腔

请先告诉我你打算怎么做，等我点 Approve 再开始。

这个任务对 Agent 的「读表 + 算数 + 画图」能力是个综合考验，跑通一次基本能定型，每周复用只换数据源文件名就行。

安全须知：Agent 不是无脑放手的工具

Agent 强是真强，但有几条底线必须守，省得出事：

不要让它直接付款：哪怕你信任它，让它走到付款页就主动接管，自己输卡号。
不要让它代发对外邮件：让它起草，你自己点发送。代发出错的政治后果通常比省的那点时间贵得多。
重要账号开二步验证：万一 Agent 误操作，2FA 是最后一道防线。
跑完看一遍 Activity 时间线：Agent 偶尔会自作主张走捷径，看时间线能发现哪一步偏离了。

下一步：把 Agent 串进你的 AI 工作流

Agent 是 ChatGPT 从「问答工具」走向「真助理」的拐点。如果你想把它和其他能力组合起来，下面几个方向值得继续看：

想让 AI 定时主动给你推送 → ChatGPT Tasks 怎么用
想让 AI 替你写深度调研报告 → ChatGPT Deep Research 怎么用
想把对话沉到知识库里反复用 → ChatGPT Projects 怎么用
想知道 ChatGPT vs Claude 在 Agent 上谁更强 → ChatGPT vs Claude
想从零了解 AI Agent 这一整个赛道 → AI Agent 教程入口

一句实话：Agent 现在还会犯错，但它是你能用最低成本体验「AI 替你做事」的入口，先用起来，半年后你会感谢现在的自己。