ChatGPT Agent 模式怎么用？官方上手教程

30 秒了解：ChatGPT Agent 模式是什么

ChatGPT Agent 模式是让 ChatGPT 自己开浏览器、上网查资料、下载文件、写代码、整理结果，全程不需要你盯着的能力。 它和你平时在 ChatGPT 里问一句答一句完全不同——你给目标，它把整件事跑完。

举个区别：你想做一份「2026 年北京马拉松报名指南」。

普通 ChatGPT：你问一句它答一句，可能要来回 10 轮才整理出来
ChatGPT Agent 模式：你说一句话，它自己打开 5 个网站、抓最新报名信息、查时间地点、列对比表、最后给你一份完整文档

适合谁用：

想把重复网页操作自动化的运营/销售
经常要跨网站查信息整理对比的人
想体验真正「干活的 AI」的好奇者

注意：截至 2026 年 5 月，ChatGPT Agent 仅向 Plus、Pro、Team、Enterprise 订阅用户开放，免费版没有。

准备工作

开启 Agent 模式前需要 3 个前提：

项目	要求
账号	ChatGPT Plus（每月 20 美元）或更高级别订阅
网络	海外网络（中国大陆需要科学上网，账号注册区域不能是中国）
设备	网页版（首发）、桌面端，移动端正在陆续支持
浏览器	最新版 Chrome / Edge / Safari，需开启 JavaScript

如果你还没注册 ChatGPT 账号：先看 ChatGPT 怎么注册这篇保姆教程。 如果你还在用免费版：先看 ChatGPT 是免费的吗决定要不要升级 Plus。

详细操作步骤

第 1 步：进入 ChatGPT 网页版

打开 chatgpt.com，用你的 Plus / Pro 账号登录。

[此处放截图：ChatGPT 网页主界面，红框标注左上角模型选择菜单]

第 2 步：在工具选择器里选「Agent」

在新对话输入框下方有一个工具菜单（图标可能是「+」或「工具」字样）。点开后会看到几个选项：

搜索 Search
深度研究 Deep research
图像 Image
代理 Agent

点击 Agent。第一次开启会弹一个隐私确认窗，告诉你 Agent 会在云端的浏览器里操作、会用你授权的账户登录网站，确认无误后点同意。

[此处放截图：工具选择菜单，红框标注 Agent 选项]

看不到 Agent 选项？三种可能：1) 你不是 Plus/Pro/Team 订阅；2) 你的账号还没被灰度（等几天）；3) 你的账号注册地区不在支持列表里。

第 3 步：写第一个任务指令

Agent 模式的指令要比平常对话更明确——说清楚目标 + 输出形式 + 关键约束。一个好的初次任务示例：

帮我从 36 氪、虎嗅、晚点 3 个网站，找出 2026 年 5 月最火的 5 个 AI Agent 创业公司报道，整理成表格：公司名、所在地、创始人、融资情况、产品方向。最后导出成 Markdown。

按回车提交。

第 4 步：观察执行过程

Agent 启动后，右侧会出现一个执行进度面板。你能看到：

AI 正在做的每一步（如「正在打开 36kr.com」）
它当前在哪个网页上、做什么操作
实时的浏览器截图

[此处放截图：Agent 执行界面，左侧对话区，右侧浏览器实时画面]

整个过程你不需要盯着，可以去做别的事，做完它会通知你。

第 5 步：处理「权限请求」中断

Agent 跑到某些「敏感操作」会暂停问你：

要登录某个网站时（用你授权的账号）
要付钱时（订单、支付）
要发送/提交某些不可逆操作时

这是设计上的安全机制——可以点同意或拒绝，也可以补充具体指示后让它继续。

⚠️ 永远不要在不看的情况下盲点「全部同意」。Agent 在云端浏览器里操作的是你真实的账号，错了可能造成真实损失。

第 6 步：查看结果 + 下载文件

任务完成后，结果会出现在主对话区。如果是表格、文档、代码、图片，都可以一键下载到本地。

第 7 步：随时打断 / 接管

Agent 跑的过程中你可以：

暂停：点暂停按钮，让它停下等你指示
接管：直接用键鼠操作云浏览器，告诉它你的下一步意图
停止：终止当前任务

接管功能很重要——遇到验证码、需要你输入密码的场景，Agent 会主动让出控制权。

5 个高级用法 / 隐藏玩法

玩法	具体场景
让它定时跑（结合 Tasks）	每天早上 8 点抓昨日竞品资讯
多步串联	抓数据 → 写报告 → 发邮件 → 同步 Notion
用自然语言”教”它	第一次手把手指导，之后能自己复刻
配合 Connectors	接 Gmail、Google Drive、Dropbox 等账号
让它写代码 + 跑测试	浏览器里调出 Python 沙箱，写代码运行验证

ChatGPT 在 Agent 模式里其实是融合了多个能力：浏览（Browse）+ Operator（操作浏览器）+ Deep Research（深度调研）+ Python 沙箱。看完这篇还想深入，可以看 ChatGPT Tasks 怎么用，配合定时任务能让 Agent 真正变成你的 24 小时员工。

常见坑 + 解决办法

现象	可能原因	解决办法
看不到 Agent 选项	账号未灰度 / 不是 Plus / 注册地区不支持	等几天或检查订阅状态
Agent 跑到一半卡住	网页改版 / 登录态过期 / 触发风控	点接管，手动处理一下让它继续
任务跑完不准确	指令不够明确 / 输出格式没说清	加「输出格式」「关键约束」「不要做 X」
同样指令第二次结果不同	LLM 本身有随机性 + 网页有变化	不必苛求 100% 一致，验证关键指标即可
一直让我确认权限	涉及付款、发送等高风险操作	这是安全设计，建议保留这个机制
跑得很慢	一个任务 30 步左右是正常的	让它跑完再看结果，不要中断重来

一个完整实战案例：让 Agent 自动出周报

下面这个 prompt 是一个能跑通的真实模板，复制粘贴改下信息就能用：

📋 Prompt 模板

你是我的工作周报助手。请完成以下任务：

任务：

打开我的 Google Calendar，导出本周（周一到周日）所有日程
把日程按以下类别归类：客户会议、内部会议、产品评审、专注工作时间、其他
统计每个类别本周总时长
打开 Notion，找到我本周写的所有日报（标签为 daily-log）
把日报里的「今日完成」和「明日计划」抽出来
综合以上信息，生成本周周报，包含 4 部分：
- 本周时间分布（含柱状图）
- 完成的关键事项 5 条（按重要度排序）
- 遇到的问题和未解决项
- 下周 3 大重点

输出格式：

Markdown，带二级标题
直接发到我的飞书「本周周报」群

如果遇到需要登录的页面，停下来问我；不可逆操作（如发送）发送前确认。

第一次跑会比较慢（约 10-20 分钟），完成后你确认能用，下次直接「按上次模板再跑一遍」就能秒生成。

安全注意事项（必看）

ChatGPT Agent 是在 OpenAI 云端的浏览器里跑的，但它操作的是你授权登录的真实账号——所以这几件事必须警惕：

不要把高价值账号（网银、企业邮箱、政企平台）轻易交给 Agent
任何涉及钱的操作（下单、转账、订阅）都要让它停下来等你确认
跑完一个敏感任务建议手动登出账号 / 撤销授权
定期检查 OpenAI 的连接器（Connectors）授权列表，删除不用的

Agent 越强，安全意识越重要。详细安全机制建议看官方的 ChatGPT Agent 帮助页（原文需科学上网）。

进阶 / 下一步

如果你已经跑通了第一个 Agent 任务，继续看：

AI Agent 是什么？1 篇看懂智能体的 5 大组件（理解原理）
Computer Use 是什么？让 AI 操作鼠标键盘（深入底层能力）
GPT Builder 实战：从零搭建你的第一个 GPT（搭自己的专用 Agent）
国内 AI Agent 平台盘点（不能科学上网的替代方案）
ChatGPT 完整教程（先把 ChatGPT 基础玩熟）

常见问题

Q：ChatGPT Agent 跟 GPTs 有啥区别？ A：GPTs 是「定制 ChatGPT 的能力包」（指令 + 知识库 + 工具）；Agent 是「让 ChatGPT 自己跑流程的工作模式」。GPTs 是配置，Agent 是行为。两者可以叠加：你可以做一个 GPT 然后在 Agent 模式里跑它。

Q：Agent 模式每天能跑几次？ A：Plus 用户每个月有 Agent 使用额度（具体次数 OpenAI 官方页有最新数据），跑完了要等下个月或升级 Pro。

Q：免费版能用 ChatGPT Agent 吗？ A：截至 2026 年 5 月不能。最低门槛是 ChatGPT Plus（每月 20 美元）。

Q：Agent 跑出来的结果可以二次编辑吗？ A：可以。结果就是普通的文本/表格/代码，下载下来想怎么改都行。也可以让 Agent「在上次结果基础上再做 X」继续优化。

Q：能让 Agent 操作我本地电脑吗？ A：当前 ChatGPT Agent 跑在 OpenAI 云端浏览器，不能直接控制你本地电脑。如果想让 AI 操作你本地，看 Computer Use 是什么。

Q：在中国大陆能用 ChatGPT Agent 吗？ A：需要 1) 海外网络环境 2) 海外区域的 ChatGPT 账号 3) Plus 订阅。门槛较高。如果你不想折腾，可以看国内 AI Agent 平台盘点找国产替代方案。