🤖 AI 跟我学 新手入门

ChatGPT Agent 模式怎么用?官方上手教程

ChatGPT Agent 模式怎么用?这篇手把手教你开启 Agent 模式、跑通第一个自动化任务、避开权限和安全坑,2026 最新版教程

发布 2026/04/18 📎 参考官方文档

30 秒了解:ChatGPT Agent 模式是什么

ChatGPT Agent 模式是让 ChatGPT 自己开浏览器、上网查资料、下载文件、写代码、整理结果,全程不需要你盯着的能力。 它和你平时在 ChatGPT 里问一句答一句完全不同——你给目标,它把整件事跑完

举个区别:你想做一份「2026 年北京马拉松报名指南」。

  • 普通 ChatGPT:你问一句它答一句,可能要来回 10 轮才整理出来
  • ChatGPT Agent 模式:你说一句话,它自己打开 5 个网站、抓最新报名信息、查时间地点、列对比表、最后给你一份完整文档

适合谁用

  • 想把重复网页操作自动化的运营/销售
  • 经常要跨网站查信息整理对比的人
  • 想体验真正「干活的 AI」的好奇者

注意:截至 2026 年 5 月,ChatGPT Agent 仅向 Plus、Pro、Team、Enterprise 订阅用户开放,免费版没有。

准备工作

开启 Agent 模式前需要 3 个前提:

项目要求
账号ChatGPT Plus(每月 20 美元)或更高级别订阅
网络海外网络(中国大陆需要科学上网,账号注册区域不能是中国)
设备网页版(首发)、桌面端,移动端正在陆续支持
浏览器最新版 Chrome / Edge / Safari,需开启 JavaScript

如果你还没注册 ChatGPT 账号:先看 ChatGPT 怎么注册 这篇保姆教程。 如果你还在用免费版:先看 ChatGPT 是免费的吗 决定要不要升级 Plus。

详细操作步骤

第 1 步:进入 ChatGPT 网页版

打开 chatgpt.com,用你的 Plus / Pro 账号登录。

[此处放截图:ChatGPT 网页主界面,红框标注左上角模型选择菜单]

第 2 步:在工具选择器里选「Agent」

在新对话输入框下方有一个工具菜单(图标可能是「+」或「工具」字样)。点开后会看到几个选项:

  • 搜索 Search
  • 深度研究 Deep research
  • 图像 Image
  • 代理 Agent

点击 Agent第一次开启会弹一个隐私确认窗,告诉你 Agent 会在云端的浏览器里操作、会用你授权的账户登录网站,确认无误后点同意。

[此处放截图:工具选择菜单,红框标注 Agent 选项]

看不到 Agent 选项?三种可能:1) 你不是 Plus/Pro/Team 订阅;2) 你的账号还没被灰度(等几天);3) 你的账号注册地区不在支持列表里。

第 3 步:写第一个任务指令

Agent 模式的指令要比平常对话更明确——说清楚目标 + 输出形式 + 关键约束。一个好的初次任务示例:

帮我从 36 氪、虎嗅、晚点 3 个网站,找出 2026 年 5 月最火的 5 个 AI Agent 创业公司报道,整理成表格:公司名、所在地、创始人、融资情况、产品方向。最后导出成 Markdown。

按回车提交。

第 4 步:观察执行过程

Agent 启动后,右侧会出现一个执行进度面板。你能看到:

  • AI 正在做的每一步(如「正在打开 36kr.com」)
  • 它当前在哪个网页上、做什么操作
  • 实时的浏览器截图

[此处放截图:Agent 执行界面,左侧对话区,右侧浏览器实时画面]

整个过程你不需要盯着,可以去做别的事,做完它会通知你。

第 5 步:处理「权限请求」中断

Agent 跑到某些「敏感操作」会暂停问你:

  • 要登录某个网站时(用你授权的账号)
  • 要付钱时(订单、支付)
  • 要发送/提交某些不可逆操作时

这是设计上的安全机制——可以点同意或拒绝,也可以补充具体指示后让它继续。

⚠️ 永远不要在不看的情况下盲点「全部同意」。Agent 在云端浏览器里操作的是你真实的账号,错了可能造成真实损失。

第 6 步:查看结果 + 下载文件

任务完成后,结果会出现在主对话区。如果是表格、文档、代码、图片,都可以一键下载到本地。

第 7 步:随时打断 / 接管

Agent 跑的过程中你可以:

  • 暂停:点暂停按钮,让它停下等你指示
  • 接管:直接用键鼠操作云浏览器,告诉它你的下一步意图
  • 停止:终止当前任务

接管功能很重要——遇到验证码、需要你输入密码的场景,Agent 会主动让出控制权。

5 个高级用法 / 隐藏玩法

玩法具体场景
让它定时跑(结合 Tasks)每天早上 8 点抓昨日竞品资讯
多步串联抓数据 → 写报告 → 发邮件 → 同步 Notion
用自然语言”教”它第一次手把手指导,之后能自己复刻
配合 Connectors接 Gmail、Google Drive、Dropbox 等账号
让它写代码 + 跑测试浏览器里调出 Python 沙箱,写代码运行验证

ChatGPT 在 Agent 模式里其实是融合了多个能力:浏览(Browse)+ Operator(操作浏览器)+ Deep Research(深度调研)+ Python 沙箱。看完这篇还想深入,可以看 ChatGPT Tasks 怎么用,配合定时任务能让 Agent 真正变成你的 24 小时员工。

常见坑 + 解决办法

现象可能原因解决办法
看不到 Agent 选项账号未灰度 / 不是 Plus / 注册地区不支持等几天或检查订阅状态
Agent 跑到一半卡住网页改版 / 登录态过期 / 触发风控点接管,手动处理一下让它继续
任务跑完不准确指令不够明确 / 输出格式没说清加「输出格式」「关键约束」「不要做 X」
同样指令第二次结果不同LLM 本身有随机性 + 网页有变化不必苛求 100% 一致,验证关键指标即可
一直让我确认权限涉及付款、发送等高风险操作这是安全设计,建议保留这个机制
跑得很慢一个任务 30 步左右是正常的让它跑完再看结果,不要中断重来

一个完整实战案例:让 Agent 自动出周报

下面这个 prompt 是一个能跑通的真实模板,复制粘贴改下信息就能用:

📋 Prompt 模板

你是我的工作周报助手。请完成以下任务:

任务:

  1. 打开我的 Google Calendar,导出本周(周一到周日)所有日程
  2. 把日程按以下类别归类:客户会议、内部会议、产品评审、专注工作时间、其他
  3. 统计每个类别本周总时长
  4. 打开 Notion,找到我本周写的所有日报(标签为 daily-log)
  5. 把日报里的「今日完成」和「明日计划」抽出来
  6. 综合以上信息,生成本周周报,包含 4 部分:
    • 本周时间分布(含柱状图)
    • 完成的关键事项 5 条(按重要度排序)
    • 遇到的问题和未解决项
    • 下周 3 大重点

输出格式:

  • Markdown,带二级标题
  • 直接发到我的飞书「本周周报」群

如果遇到需要登录的页面,停下来问我;不可逆操作(如发送)发送前确认。

第一次跑会比较慢(约 10-20 分钟),完成后你确认能用,下次直接「按上次模板再跑一遍」就能秒生成。

安全注意事项(必看)

ChatGPT Agent 是在 OpenAI 云端的浏览器里跑的,但它操作的是你授权登录的真实账号——所以这几件事必须警惕:

  1. 不要把高价值账号(网银、企业邮箱、政企平台)轻易交给 Agent
  2. 任何涉及钱的操作(下单、转账、订阅)都要让它停下来等你确认
  3. 跑完一个敏感任务建议手动登出账号 / 撤销授权
  4. 定期检查 OpenAI 的连接器(Connectors)授权列表,删除不用的

Agent 越强,安全意识越重要。详细安全机制建议看官方的 ChatGPT Agent 帮助页(原文需科学上网)。

进阶 / 下一步

如果你已经跑通了第一个 Agent 任务,继续看:

常见问题

Q:ChatGPT Agent 跟 GPTs 有啥区别? A:GPTs 是「定制 ChatGPT 的能力包」(指令 + 知识库 + 工具);Agent 是「让 ChatGPT 自己跑流程的工作模式」。GPTs 是配置,Agent 是行为。两者可以叠加:你可以做一个 GPT 然后在 Agent 模式里跑它。

Q:Agent 模式每天能跑几次? A:Plus 用户每个月有 Agent 使用额度(具体次数 OpenAI 官方页有最新数据),跑完了要等下个月或升级 Pro。

Q:免费版能用 ChatGPT Agent 吗? A:截至 2026 年 5 月不能。最低门槛是 ChatGPT Plus(每月 20 美元)。

Q:Agent 跑出来的结果可以二次编辑吗? A:可以。结果就是普通的文本/表格/代码,下载下来想怎么改都行。也可以让 Agent「在上次结果基础上再做 X」继续优化。

Q:能让 Agent 操作我本地电脑吗? A:当前 ChatGPT Agent 跑在 OpenAI 云端浏览器,不能直接控制你本地电脑。如果想让 AI 操作你本地,看 Computer Use 是什么

Q:在中国大陆能用 ChatGPT Agent 吗? A:需要 1) 海外网络环境 2) 海外区域的 ChatGPT 账号 3) Plus 订阅。门槛较高。如果你不想折腾,可以看 国内 AI Agent 平台盘点 找国产替代方案