🤖 AI 跟我学 新手入门

Gemini 怎么用:入门到精通的 2026 完全指南

Gemini 怎么用?这篇 8000 字完整教程把谷歌 Gemini 的入门、订阅、模型、Gems、Deep Research、Canvas、Veo 视频、Live、Agent 全部串起来讲清楚,看完就能开干

发布 2026/05/08

用一句话说清 Gemini 现在是个什么东西

2026 年的 Gemini,已经不是 2023 年那个叫 Bard 的”谷歌版 ChatGPT”,而是一套从手机系统、浏览器、Gmail 到 Google Docs 全线渗透的 AI 助手。 你长按安卓手机的电源键能呼出它、打开 Gmail 写邮件时它在右边等着、Chrome 浏览器侧栏里它能读懂当前网页。

如果你两年前试过一次 Bard 觉得”不如 ChatGPT 就关掉了”,今天再打开 Gemini 多半会有一种被时代落下的感觉:从模型能力(Gemini 3 Pro 已经追上 GPT-5)、到多模态(图、视频、PDF、音频原生支持)、再到生态集成(深度嵌进 Google 全家桶)。

这篇 8000 字的 Pillar 教程,目标是把谷歌 Gemini 现在这套体系从头到尾捋清楚一遍——你看完应该能:

  • 判断自己要不要用 Gemini、买哪个档位
  • 在 5 分钟内装好、登好、开始用
  • 了解每个核心功能(Gems / Deep Research / Canvas / Veo / Live / Agent)的边界
  • 知道哪些场景下 Gemini 比 ChatGPT、Claude、国产 AI 更香
  • 避开多数新手踩的坑

不需要懂技术。每一段后面都接 cluster 里更详细的单篇教程链接——这一篇是地图,需要细节再点进去。

一、Gemini 是什么、和你以前用的 AI 有啥不一样

一句话定位

Gemini 是谷歌从 2023 年底开始做的 AI 助手品牌。最早叫 Bard,2024 年 2 月改名 Gemini,背后的模型也从最早的 LaMDA 一路迭代到现在的 Gemini 3 系列

它的核心定位:对标 ChatGPT 的对话 AI + 深度集成谷歌生态的全场景助手

详细的”Gemini 是什么”角度看 Gemini 是什么?谷歌 AI 全家桶入门

和 ChatGPT 的关键区别

抛开”哪家模型强”的口水战,Gemini 和 ChatGPT 在产品形态上有三个真正影响日常使用的区别:

区别 1:原生多模态 vs 后期补齐

Gemini 从 1.0 开始就是原生多模态——文字、图、视频、音频、PDF 用同一套架构处理。ChatGPT 是先有文本、后接图、再接视频,多模态像是后期补的。日常感受是:把一段几分钟的视频扔给 Gemini,它能直接讲出每一帧的内容;同样的事 ChatGPT 经常要走”转码 + 抽帧 + 分析”几步才行。

区别 2:谷歌生态深度集成 vs 相对独立

Gemini 能直接读你的 Gmail、查你的 Google Calendar、调你的 Google Drive 文件。ChatGPT 要做这些事需要装插件、走 OAuth,能力薄一档。代价是:如果你不是谷歌服务的重度用户(用 QQ 邮箱、用国内日历),Gemini 这部分价值就少一半。

区别 3:上下文窗口的尺度差

Gemini 3 Pro 在付费版给 100 万 token 的上下文(约 120 万汉字),能塞一整本《红楼梦》进去做整体分析。ChatGPT 的 GPT-5 系列通常是 32K-200K。如果你常处理超长文档(财报、法律合同、整本书),Gemini 在这一项上没有对手。

完整横评看 Gemini vs ChatGPT 2026 谁是 AI 之王(待发布)和 Gemini vs Claude 深度横评(待发布)。

和国产 AI 比怎么样

对国内用户来说,更现实的对比是 Gemini vs DeepSeek / 豆包 / Kimi。一句话总结:

  • Gemini 强的地方:多模态原生、超长上下文、谷歌生态、Veo 视频、Deep Research
  • 国产 AI 强的地方:中文文化语境、不用翻墙、国内服务集成、免费额度大方

如果你纯中文场景 + 不用谷歌服务,国产 AI 大概率够用——参考 国产 AI 完全对比Kimi 完全使用指南。如果你有谷歌生态、有长文档处理、有视频生成需求,Gemini 难以替代。

二、装机和注册:5 分钟从零到能用

你需要什么

  • 一个谷歌账号(QQ 邮箱也能注册,但建议用 Gmail)
  • 一个支持 Gemini 的地区(大陆不在名单内,详见 Gemini 国内可用吗
  • 一台 iOS 16+ 的 iPhone 或 Android 9+ 的安卓手机(如果想用 App)
  • 一个 Chrome 浏览器(如果想用网页版或 Chrome 内置 Gemini)

三个入口怎么选

Gemini 有三大入口:手机 App、网页版(gemini.google.com)、Chrome 浏览器内置。背后是同一个账号、同一份聊天历史。

  • 手机 App:通勤、语音对话、随手拍照查问题
  • 网页版:写长 prompt、上传文件、Canvas / Deep Research 复杂任务
  • Chrome 内置:读当前网页、跨 tab 比较、翻译

详细横向对比和搭配建议看 Gemini 三大入口对比

新手建议:先开网页版试一周,确定要不要长期用之后再装 App。

App 怎么下载

  • iOS:App Store 搜「Gemini」,认准 Google LLC
  • Android:多数 2024 年后的安卓机已经预装,没有就去 Google Play 搜

大陆用户的特殊操作(切 Apple ID、解决 GMS 等)看 Gemini App 怎么下载

第一次打开必做的 4 个设置

  1. 登录 Google 账号:如果显示”Gemini isn’t available in your country”,是地区问题不是 App 问题
  2. 决定是否启用 Hey Google 语音唤醒:习惯语音就开,重视隐私就关
  3. 决定是否设为默认助手(仅 Android):建议设为默认,Gemini 比 Google Assistant 智能太多
  4. 关掉 Gemini Apps Activity(强烈推荐):在 myactivity.google.com 关闭,对话不会被用来训练

完整首次设置流程看 Gemini App 怎么下载

三、Gemini 的 4 个模型版本怎么选

2026 年 5 月,Gemini 3 是主推代际,分成四个变体:

4 个模型一图看完

版本速度适合什么哪个档位能用
Fast极快日常聊天、翻译一句话免费起
Thinking中等数学题、需要”先想再答”的任务免费有少量、Plus 起稳定
Pro中等90% 默认场景免费每天 30 次
Deep Think 3.1极限推理(奥赛题、科研建模)Ultra 专属

三个原则记住就够

  1. 默认用 Pro——大多数任务的最佳选择
  2. 简单事用 Fast——别浪费 Pro 额度
  3. 复杂推理用 Thinking 或 Deep Think——前者付费就行,后者要 Ultra

详细的版本能力边界、切换方式、场景速查表看 Gemini 各版本怎么选

旧版本(1.5 / 2.0 / 2.5)还能用吗

消费级 App 和网页版上看不到了,2025 年底统一升级。旧版本只在 Google AI Studio 和 Vertex AI(开发者/企业版)里还能调到。普通用户基本不会接触。

四、四档套餐:免费 / Plus / Pro / Ultra 怎么选

一张表说清

档位月费Pro 额度Deep Research生图视频上下文
免费030/天不能用基础不能标准
AI Plus19.99 美元100/天12 次/天50 张/天2 条/天12.8 万 token
AI Pro39.99 美元500/天20 次/天100 张/天3 条/天100 万 token
AI Ultra249.99 美元最高一档120 次/天1000 张/天5 条/天100 万 token

我应该买哪一档

你的情况推荐档位
第一次用 AI免费版
每天写一两小时邮件/文档免费版
每天用 2-4 小时做调研、写长文AI Plus
你需要读 50 页以上的长文档AI Pro(要 100 万 token)
做 AI 视频内容创作AI Pro 起步
科研、需要 Deep ThinkAI Ultra
公司报销AI Ultra 闭眼买

完整价格分析、付款方式、退款规则、地区差价看 Gemini 多少钱 AI Pro/Ultra 套餐对比

五、Gems:Gemini 版的 GPTs

Gems 是什么

Gems 是 Gemini 上的自定义 AI 助手,类似 ChatGPT 的 GPTs。每个 Gem 是一个”预设了角色、规则、知识”的对话入口。

举例:

  • “周报小助手”:预设你公司模板,发它本周做了什么,它直接出周报
  • “英语口语教练”:每次对话都用英语 + 给你纠错
  • “辅导孩子作业”:限定只解释思路、不直接给答案

你能用 Gems 做什么

  • 用谷歌预设的 Gems:登录后侧栏就能选,覆盖学习、健身、写作、编程等
  • 自己做一个 Gem:写一段”系统提示词”+ 上传几份知识文件 = 你的专属助手
  • 分享 Gem 给同事:团队可以复用

适合谁

  • 重复做同一类任务的人(每周都要写周报、每天都要回特定模板邮件)
  • 想给家人/同事做”傻瓜版 AI”的人(你写好 Gem,他们只管对话)
  • 想试试”自己捏一个 AI 助手”的人

怎么开始

侧栏「Gems → Explore Gems」浏览谷歌预设的,找一两个适合你工作的;想自己做点「Gems → New Gem」,里面有引导。

详细教程:

六、Deep Research:让 AI 替你跑一次完整调研

Deep Research 是什么

你给一个调研课题(“对比 2026 年五家 AI 公司的融资情况”),Deep Research 会:

  1. 自己上网搜几十个网页
  2. 阅读、对比、整合
  3. 大概 20-40 分钟后给你一份 10-30 页的中文 PDF / Word 报告

整个过程你不用管,它”工作”的时候你能离开屏幕。

适合什么场景

  • 行业调研:「新能源车 2026 年市场份额」
  • 竞品分析:「ChatGPT 和 Gemini 在企业市场的对比」
  • 学术调研:「过去 5 年量子计算的关键论文」
  • 决策支持:「我想买 Macbook,Pro 和 Air 哪个适合做剪辑」

不适合什么

  • 需要”内部数据”的调研(它只能看公开网页)
  • 需要”非常新”的信息(它的搜索有几小时到几天的延迟)
  • 简单事实查询(杀鸡用牛刀)

怎么用

  • 网页版:在 prompt 输入框上方选「Deep Research」模式
  • 给一个具体的、有边界的课题
  • 等它出一份大纲让你确认(这一步可以改方向)
  • 然后它去执行

额度

  • 免费版:不能用
  • AI Plus:12 次/天
  • AI Pro:20 次/天
  • AI Ultra:120 次/天

详细教程:Gemini Deep Research 怎么用 系列。

它和 ChatGPT Deep Research、Perplexity 比怎么样

各有所长:Gemini Deep Research 在”长报告 + 引用清晰”上最强,ChatGPT Deep Research 在”读单一长文档”更好,Perplexity 在”快速实时检索”上更利索。

详细横评看 Deep Research 对比 系列。

七、Canvas:把 Gemini 变成你的协作画布

Canvas 是什么

Canvas 是一个右边的协作面板——你在左边和 Gemini 对话,它把”输出物”(代码、文档、网页)写在右边。区别于普通对话:

  • 输出物是可编辑的,你能直接改
  • 修改后可以让 Gemini 基于改动继续迭代
  • 网页 / 应用可以实时预览运行

你能用 Canvas 做什么

  • 写长文档:让它生成大纲 → 你改大纲 → 它按新大纲扩写 → 你润色
  • 写代码:让它写一个网页 → 右边直接预览 → 改样式 → 实时看效果
  • 做小程序原型:「做一个待办清单网页,支持拖拽排序」一句话出可运行版本
  • 做 PPT 文案:左边讨论结构,右边它直接出每页文字

适合谁

  • 写长文档的人(产品经理、写手、研究者)
  • 想试着做小工具的非程序员(不用配环境,直接看效果)
  • 需要”边讨论边产出”的人

怎么开始

在网页版 Gemini 里,prompt 输入框上方选「Canvas」模式即可。

详细教程:Gemini Canvas 怎么用 系列。Canvas 和 ChatGPT Canvas 的对比见 Canvas 对比 系列。

八、Veo:用文字生成 8 秒带声短视频

Veo 是什么

Veo 是谷歌的文生视频模型,集成在 Gemini App 里。你写一句话描述场景,它生成一段 8 秒钟的视频,自带背景音和环境音(不是无声的)。

举例:

  • “一只橘猫在窗台上打哈欠,阳光从窗外照进来”
  • “雨夜的东京街头,霓虹灯倒映在湿漉漉的地面上,行人撑伞经过”

谁能用

  • AI Plus:2 条/天
  • AI Pro:3 条/天
  • AI Ultra:5 条/天
  • 免费版:不能用

每条视频 8 秒、带声、1080p。

适合什么

  • 短视频素材(口播视频的 B-roll)
  • 创意概念演示(提案里放一段视觉示意)
  • 个人创作(朋友圈、小红书的视觉补充)

不适合什么

  • 长视频(一次最多 8 秒)
  • 严格的人物连贯(生成视频里同一个人的脸会变)
  • 文字标识(视频里的字经常乱码)

详细教程:Gemini Veo 生成视频教程 系列。和 Sora、可灵的横评看 Veo vs Sora vs 可灵 系列。

九、Gemini Live:和 AI 像朋友一样语音聊天

Gemini Live 是什么

Gemini Live 是实时语音对话模式。你按下麦克风按钮,可以像跟真人聊天一样:

  • 中间打断它(说”等等,我换个问题”)
  • 它能听出你的情绪
  • 多个语音可选(包括女声、男声、不同口音)
  • 同时支持看你的摄像头(拍东西让它讲)

适合什么

  • 通勤的时候问问题(不用看屏幕)
  • 练英语口语(让它当外教)
  • 走路时让它读邮件、读新闻
  • 厨房做菜,手脏的时候问步骤
  • 给孩子讲睡前故事(让 Gemini 讲)

怎么用

  • 手机 App:底部麦克风按钮长按 → 进入 Live 模式
  • 体验最佳的是:戴上蓝牙耳机 + 用 Android

详细教程:Gemini Live 语音对话 系列。

十、Gemini Agent:让 AI 自己跑多步流程

Agent 是什么

Gemini Agent 是 2026 年初推出的多步任务自动执行功能。你给一个任务(“帮我订下周三晚上 7 点 5 个人的火锅,预算人均 200,要好评”),它会:

  1. 上网搜符合条件的餐厅
  2. 对比价格、评分、距离
  3. 推荐 2-3 家给你
  4. 你选一家后,它打电话或在线预订
  5. 把结果加到你的 Google Calendar

整个过程它会问你关键节点的确认(“我看到这家有露天位,需要吗?”),但不需要你一步步指挥。

适合什么

  • 重复的多步流程(订餐、订票、约人)
  • 跨多个网站的对比
  • 安卓 App 内自动操作

谁能用

  • AI Plus:基础 Agent
  • AI Pro:Screen Automation 20 次/天
  • AI Ultra:Screen Automation 120 次/天

Agent 还在快速迭代,2026 年底前会大幅扩展能用的”动作”。

详细教程:Gemini Agent 多步任务实战 系列。

十一、Connected Apps:把 Gemini 接进你的 Google 全家桶

Connected Apps 是什么

Connected Apps 是 Gemini 和谷歌服务(以及部分第三方)的官方集成入口。开启之后,Gemini 能直接:

  • 读你的 Gmail:「找一下上周和老板讨论 Q3 计划的邮件」
  • 查 Google Calendar:「下周三我有空吗?」
  • 搜 Google Drive:「找一下我去年写的产品 spec」
  • 看 Google Docs:「帮我把这份文档润色一下」
  • 查 YouTube:「这个视频讲了啥」
  • 用 Maps:「最近的星巴克在哪」
  • 接入 GitHub:「读一下这个仓库的代码」

怎么开

侧栏「设置 → Connected Apps」,找到你想接的服务,点「Connect」授权。

安全性

  • 你可以单独控制每个应用的权限
  • 随时可以撤销授权
  • 谷歌承诺连接数据不用于训练(除非你明确同意)

注意

  • 工作/学校账号默认权限更紧,管理员可能限制了某些 Connected Apps
  • 接 GitHub 是付费功能,AI Pro 起

详细教程:

十二、生图 / 生音乐 / 抽认卡 / 绘本:那些好玩的小功能

生图(Nano Banana / Imagen)

Gemini 的图片生成走两个模型:Nano Banana(速度优先、社交媒体级别)和 Imagen(质量优先、印刷级别)。

  • 一句话描述就出图
  • 可以基于上传的图改图(换背景、改风格、加元素)
  • 免费版每天给少量额度

详细教程:Gemini 生成图片教程 系列。

生音乐(Lyria)

Lyria 是谷歌的音乐生成模型,能生成 30 秒的纯音乐片段。适合做短视频背景音乐、个人 demo。

  • AI Plus:10 首/天
  • AI Pro:20 首/天
  • AI Ultra:100 首/天

详细教程:Gemini 生成音乐教程 系列。

抽认卡和测验

把任何 PDF / 文档 / 一段对话变成抽认卡(Flashcards)测验(Quiz),用来复习和检测自己学到了多少。学生党、考证党的神器。

详细教程:Gemini 生成抽认卡和测验 系列。

绘本生成

给孩子定制睡前故事书:你说主题(“小兔子的勇敢冒险”),Gemini 生成文字 + 配套插图,可以下载成 PDF 打印或在屏幕上读。

详细教程:Gemini 绘本生成 系列。

音频概览(Audio Overview)

把对话或文档转成两人对谈风格的播客(这一招原本是 NotebookLM 的招牌,Gemini App 里也集成了)。开车通勤时让 AI”播报”你今天要看的资料,节省时间。

详细教程:Gemini Audio Overview 系列。

十三、记忆和自定义指令:让 Gemini 越用越懂你

记忆功能

Gemini 会记住你过去聊过的关键信息(你的工作、家庭、偏好),下次对话直接用。

举例:

  • 你告诉过它”我在做出海电商业务,主要市场是东南亚”
  • 下次问”帮我写一份月度计划”,它会自动结合电商和东南亚的背景

可以在「设置 → 记忆」里看到它记住了什么,也能手动删除。

详细教程:Gemini 记忆功能 系列。

自定义指令

类似 ChatGPT 的 Custom Instructions——你预先告诉 Gemini “怎么称呼你”、“你的工作背景”、“你希望它怎么回答”,之后所有对话都遵守。

详细教程:Gemini 自定义指令实战 系列。

十四、上传文件、读 PDF、看图片

上传什么

Gemini 支持的文件类型:

  • 文档:PDF / Word / TXT / Markdown
  • 表格:Excel / Google Sheets / CSV
  • 演示:PowerPoint / Google Slides
  • 代码:几乎所有主流语言的源代码
  • 图片:JPG / PNG / WebP / HEIC
  • 音频:MP3 / WAV / FLAC
  • 视频:MP4 / MOV
  • 压缩包:ZIP(会解压后读内容)

单次上传限制

  • 免费版:单次最大 100 MB
  • 付费版:单次最大 2 GB
  • 同一对话上下文:AI Pro 起 100 万 token,普通文档塞十几份没问题

经典玩法

  • “帮我总结这份 80 页财报的核心观点”
  • “把这张截图里的英文菜单翻译成中文”
  • “听这段 1 小时录音,帮我整理一份会议纪要”
  • “看这段视频,告诉我它讲了什么”

详细教程:Gemini 上传 PDF 与文件分析 系列。

十五、定时任务(Scheduled Actions)

Gemini 能定时执行重复任务:

  • “每周一早 9 点,把上周邮件里的重点整理给我”
  • “每天晚上 8 点,根据明天日历,给我一份明日计划”
  • “每月 1 号,自动生成上月支出总结”

设置一次,之后 Gemini 自己跑,结果发到你的对话或邮箱。

详细教程:Gemini 定时任务 Schedule Actions 系列。

十六、Gemini 在 Chrome 浏览器里能做什么

三个核心能力

1. 读当前网页

侧栏点 Gemini 图标,问”帮我总结这一页”,它直接读浏览器里的页面内容。不用复制粘贴。

2. 跨 tab 比较

打开三家商品页,让 Gemini 横向对比价格、配置、评论。比你自己来回切快十倍。

3. Agentic Browsing(AI Pro 起)

让 Gemini 自己点链接、翻页、找信息。比如”帮我在某家网站找出五星好评的耳机,按价格排序”,它能自己操作浏览器跑流程。

详细教程:Gemini Chrome 怎么用 系列。

十七、Gemini 在 Workspace 里:Gmail / Docs / Sheets 集成

这是什么

如果你用 Google Workspace(个人或企业版),Gemini 直接出现在每个谷歌服务的侧栏:

  • Gmail 里:帮你写回复、改语气、总结长邮件
  • Docs 里:写大纲、扩写、改写、润色
  • Sheets 里:写公式、解释公式、做数据分析
  • Slides 里:生成幻灯片大纲、给图找素材
  • Meet 里:实时记笔记、生成会议纪要

谁能用

  • Workspace 个人版:默认包含 Gemini
  • Workspace 企业版:包含在 Business / Enterprise 套餐里
  • 个人 Google AI Plus / Pro:也能在 Workspace 里用 Gemini

86 个职业场景的 prompt 模板可以参考 Workspace Gemini 86 个职业 prompt(中文版) 系列。

十八、迁移:从 ChatGPT / Claude 一键导入历史

Gemini 在 2026 年初推出了”AI 平台迁移”功能:你可以一键从 ChatGPT、Claude 导入你的历史对话,作为 Gemini 的上下文起点。

适合:

  • 想换平台又舍不得历史的人
  • 想让 Gemini “继续”你之前在别家做的项目

详细教程:从 ChatGPT 迁移到 Gemini 系列。

十九、一个让你今天就上手的 prompt 套装

把下面这几段保存在备忘录里,遇到对应场景直接拷贝改。第一段是通用开场:

📋 Prompt 模板

你好。我刚开始用 Gemini,请帮我把回答风格固定成下面这样:

  • 用中文,简洁,不要套话
  • 复杂概念用一个生活化例子
  • 不确定的事情明确说”我不确定”,不要编
  • 长回答先给一句话结论,再展开

收到请回”好的”。

第二段,长文档总结模板:

📋 Prompt 模板

请帮我读这份文档,输出三部分:

  1. 一句话总结(不超过 30 字)
  2. 5 个核心观点(每条不超过 50 字)
  3. 5 个我应该追问的问题(基于这份文档值得深挖的方向)

要点必须能在文档里找到引用,不要发挥。

第三段,Deep Research 调研模板:

📋 Prompt 模板

我想调研:[课题,越具体越好]

请按下面的结构产出:

  1. 课题背景(200 字)
  2. 关键事实和数据(带来源)
  3. 三种主流观点 / 路径,每种的优劣
  4. 你的综合判断
  5. 我下一步可以做的 3 件事

总长度 3000-5000 字。引用必须有真实来源链接,没有就标”未找到来源”。

第四段,写代码模板(配合 Canvas):

📋 Prompt 模板

请用 [语言/框架] 帮我写一个 [功能描述]。

要求:

  • 代码能直接复制运行,不要伪代码
  • 关键逻辑写注释
  • 写完后告诉我怎么本地跑起来
  • 如果有依赖,列出来

完成后等我说”开始改”再迭代,不要先猜我下一步要什么。

第五段,生图模板:

📋 Prompt 模板

请生成一张图,要求:

主题:[一句话场景] 风格:[摄影 / 插画 / 像素 / 油画 / 你想要的] 构图:[特写 / 中景 / 远景 / 俯视 / 仰视] 光线:[自然光 / 日落金光 / 冷色调 / 戏剧打光] 情绪:[一两个形容词] 比例:[16:9 / 1:1 / 9:16]

如果不清楚就先生成一版,我会反馈。

这五个模板覆盖了多数日常场景。用熟了再根据自己工作改。

二十、新手最常踩的 8 个坑

按”最常见踩到 → 最少踩到”排序:

1. 一上来就开 Pro / Ultra 免费版每天 30 次 Pro 模型,多数人用不完。先用半个月再决定要不要付费。

2. 总用 Fast 想省额度 Fast 答案明显差,要返工反而更费时间。Pro 该用就用。

3. 没关 Activity 就发敏感信息 默认对话会被用于训练。涉及商业、个人隐私的内容,先去 myactivity.google.com 关掉 Gemini Apps Activity。

4. 上传一份超长 PDF 然后免费版直接报错 免费版上下文有限。读 50 页以上的文档需要 AI Pro(100 万 token)。

5. Deep Research 用得太散 “帮我调研一下 AI 行业”这种没边界的课题,出来的报告大概率没用。给具体角度(“对比 2026 年 Gemini 和 ChatGPT 在企业市场的份额”)才会出好货。

6. 期待 Veo 视频里的人脸保持一致 当前 Veo 同一个人的脸帧间会变。需要”一个角色多个镜头”的话,AI 视频在 2026 年还做不到。

7. 想用 Gemini Live 学英语却开了中文界面 Gemini Live 的语言跟你账号设置走。学英语前先在设置里把”对话语言”切到英文。

8. 取消订阅后以为立刻断了,结果继续被扣 取消是”下个月不再续费”,本月依然扣的钱用得完。

避坑系列详细教程逐步上线中,可以关注 Gemini 完全使用指南 cluster。

二十一、什么时候应该用 Gemini,什么时候不该

该用 Gemini

  • 你需要多模态原生支持(图、视频、PDF 一起处理)
  • 你常处理超长文档(>15 万字)
  • 你重度用谷歌服务(Gmail / Docs / Drive / Calendar)
  • 你想做文生视频(Veo 在国内可用方案里是顶级的之一)
  • 你需要Deep Research(行业调研、学术调研)

该用 ChatGPT

  • 你重度用自定义 GPTs 生态(GPTs Store 比 Gems 大)
  • 你做创意写作 / 文学翻译(GPT-5 系列稍胜)
  • 你的工作流和 ChatGPT 插件深度绑定

该用 Claude

  • 你重度做写代码 / 读代码Claude 编程能力业界顶级)
  • 你做长篇创作 / 法律文书(写作风格更克制)
  • 你对AI 安全有特别要求

该用国产 AI

  • 纯中文场景Kimi 的长文档、豆包 的日常对话都很强)
  • 不用谷歌服务、不出海
  • 预算有限(国产免费额度大方)
  • 在大陆 + 不想折腾

详细对比看 国产 AI 完全对比Kimi 完全使用指南讯飞星火完全使用指南

二十二、未来 12 个月 Gemini 大概率会发生什么

不预言确定的事,只说趋势:

  • Gemini 3 后会有 Gemini 4:节奏看,2026 年底前可能性大
  • Agent 能力大幅扩张:能”自己跑流程”的范围会从浏览器扩到操作系统
  • Veo 的视频时长会突破 8 秒:业界都在追,Gemini 不会例外
  • Workspace 集成会更深:Gemini 在 Gmail / Docs 里会从”侧栏助手”变成”操作主角”
  • 企业版会有更细的权限管理:响应企业对数据隔离的需求
  • 大陆可用性短期不会变:政策面没有明显松动

普通用户的策略:不要等”完美时刻”才开始用。现在的 Gemini 已经能干七成的活,等下一代发布的时候你已经熟练了,迁移成本很低。

二十三、Gemini 周边的全部教程入口

把这篇 Pillar 当作 cluster 入口,下面是已经规划的子主题(按学习路径排序)。

入门和概念

核心功能

  • Gemini Live 语音对话教程(待发布)
  • Gemini Deep Research 怎么用(待发布)
  • Gemini Canvas 一句话生成网页(待发布)
  • Gemini Deep Think 推理模式(待发布)
  • Gemini Agent 多步任务(待发布)

Gems 系列

  • Gems 是什么?Gemini 版 GPTs 入门(待发布)
  • Gemini Gems 怎么用:10 个预设助手实战(待发布)
  • Gems 怎么分享给别人(待发布)
  • Gemini Labs mini-app 转 Gem 流程(待发布)

创作功能

  • Gemini 生成图片教程(待发布)
  • Gemini Veo 生成视频教程(待发布)
  • Gemini 生成音乐教程(待发布)
  • Gemini Audio Overview(待发布)

文件和集成

  • Gemini 上传 PDF 与文件分析(待发布)
  • Gemini Connected Apps 接 Gmail/Drive(待发布)
  • Gemini 读 GitHub 代码库(待发布)
  • Gemini 管理日历(待发布)

对比横评

  • Gemini vs ChatGPT(待发布)
  • Gemini vs Claude(待发布)
  • Deep Research 三家对比(待发布)
  • Veo vs Sora vs 可灵(待发布)
  • Gems vs GPTs(待发布)

其他 AI cluster 入口

常见问题(汇总版)

Q:Gemini 和 Google Bard 是一个东西吗? A:是。Bard 是 Gemini 的旧名字,2024 年 2 月正式改名。现在的 Gemini 3 系列比 Bard 时代强了不止一个量级。

Q:免费版能用 Deep Research / Veo / Deep Think 吗? A:都不行。Deep Research 要 AI Plus 起,Veo 要 AI Plus 起,Deep Think 是 Ultra 专属。

Q:聊天历史会被用来训练吗? A:默认会。在 myactivity.google.com 关闭 Gemini Apps Activity 之后就不会。代价是你也看不到历史会话。

Q:Gemini 中文水平怎么样? A:2026 年的 Gemini 3 Pro 中文已经接近母语水平,日常对话、长文翻译、PDF 总结都没问题。诗词和网文这种文化感强的场景偶尔差点意思。

Q:手机 App 和网页版的功能差很多吗? A:核心对话能力一致。Canvas、Deep Research 在网页上体验更好。Live 语音、Screen actions(看屏幕)、长按电源键这些在手机上更顺手。

Q:能不能多人共享一个 AI Ultra 账号? A:技术上能登,但谷歌风控会监测异常登录,多次触发会封号。AI Ultra 包含家庭共享(最多 5 个家庭成员),通过正规渠道用。

Q:买了 AI Pro 在大陆能用吗? A:付费不能解决地区限制。详见 Gemini 国内可用吗

Q:Gemini 会代替 Google 搜索吗? A:短期不会。但谷歌已经把 Gemini 嵌进搜索结果(AI Overview),简单查询直接给答案。中长期看,“搜索 + AI”是常态。

Q:什么时候该升级到付费? A:当你每天用 Pro 模型超过 30 次(额度用完)、或开始想用 Deep Research / Veo / 100 万 token 上下文的时候。多数人是用免费版 1-2 个月之后才有这个需求。

Q:Gemini 会出错吗? A:会。所有 AI 都会”幻觉”(编造看起来合理但错误的事实)。重要内容必须人工核对,尤其是数字、人名、引用。Gemini 在自己答案旁有「Double-check」按钮可以让它去搜证据,但也不是 100% 可靠。


这篇 8200 字的 Gemini 完整指南到这。你现在应该有了”我什么时候用 Gemini、用哪个档位、从哪开始”的清楚答案。任何一段觉得意犹未尽的,点进对应的子文章看详细教程。

如果你之前在国产 AI 和 ChatGPT 之间来回切,多花一周认真试 Gemini,你会发现”哪个 AI 最强”是个伪问题——真正重要的是你的工作流和它的边界匹配不匹配