🤖 AI 跟我学 新手入门

Veo 怎么用?谷歌 AI 视频保姆教程

Veo 怎么用?这篇手把手讲 Google Veo 3 的开通入口、第一段视频生成、原生音频玩法、prompt 写法和国内可用方案,0 基础 5 分钟上手

发布 2026/05/18

Veo 3 是 Google DeepMind 推出的文生视频模型,2026 年通过 Google AI Pro / Ultra 订阅、Gemini App、以及 Google AI Studio 提供服务。它跟 Sora 的最大差异化是原生音频——生成视频时同步生成环境音、对话、音效,不需要后期配音。

下面这篇手把手讲 Veo 怎么用——账号准备、入口在哪、第一段视频怎么生成、原生音频怎么玩、prompt 怎么写、国内用户怎么办,全部讲清楚。

30 秒了解 Veo 是什么

Veo 是 Google 的文生视频模型,2026 年主流版本是 Veo 3,能从一句文字描述生成 5-8 秒的高清视频,最大特色是同步生成跟画面匹配的原生音频。

跟其他 AI 视频的核心差异:

  • 不是”先出视频再后期配音”,而是”画面 + 声音一次性出”
  • 跟 Gemini、Google Workspace 深度协同
  • 藏在 Google AI 订阅里,不像 Sora 那样有独立入口

适合谁用:

  • 已经在用 Gmail、Google Docs、Drive 的人
  • 内容偏对话、纪实,需要”声画一体”的创作者
  • 短视频博主想省一道后期配音工序
  • YouTube 创作者(Google 自家生态)

不适合谁:

  • 完全不用 Google 生态的人(要重新学一遍)
  • 国内大陆环境无法解决网络的人(Gemini 国内访问不到)
  • 想要复杂运镜和电影级画质的人(Sora 更强)

准备工作:3 个硬门槛

开始之前先确认这几条,缺一不可:

  • Google 账号:Gmail 邮箱即可,没有的去 accounts.google.com 注册
  • Google AI Pro 或 Ultra 订阅:起步价 20 美元/月,包 Veo 视频额度 + Gemini 高级模型 + Imagen 图像 + 2TB 云盘
  • 海外环境 + 海外信用卡:Gemini 在国内大陆环境下无法直接访问,订阅需要海外信用卡
  • 浏览器:Chrome 体验最好,Edge / Safari 也行

国内用户额外提醒:以上三条都是硬门槛。如果你不想折腾,更简单的路径是用 国产 AI 视频工具 的可灵或即梦,国内可直接访问、微信支付、画质对小白来说够用。

详细操作步骤

第 1 步:开通 Google AI Pro 订阅

打开浏览器,访问 one.google.com/about/google-ai-plans(或在 Gemini App 内点升级),登录你的 Google 账号。

[此处放截图:Google AI 订阅页面,Pro 和 Ultra 两档对比]

档位选择:

  • Google AI Pro(20 美元/月):包 Veo 视频额度 + Gemini 高级模型 + Imagen 图像 + 2TB 云盘,新手起步选这个
  • Google AI Ultra:更贵的档位,额度更大,重度用户选

Get Pro → 输入海外信用卡信息 → 订阅成功。

第 2 步:进入 Gemini 找 Veo 入口

订阅成功后,打开 gemini.google.com,用同一个 Google 账号登录。

Veo 不是独立产品,它是 Gemini 里的”视频生成”功能。入口有 2 个:

  • 方式 A:Gemini 主对话框,输入”用 Veo 生成一段视频…”,AI 会自动调起 Veo
  • 方式 B:左侧菜单或工具栏点 Video / 生成视频 按钮(界面随版本变化)

[此处放截图:Gemini 主界面,标注 Veo 入口位置]

第 3 步:写第一段 prompt 测试

输入框里写一段简单的英文 prompt 试试。Veo 对英文 prompt 理解最好,中文 prompt 也能跑但效果稍弱:

A golden retriever puppy running on a sunny beach, ocean waves in background, slow motion, with natural sound of waves and dog barking.

注意这段 prompt 明确写了”with natural sound of waves and dog barking”——这是触发 Veo 原生音频的关键。不写音频描述,Veo 默认只出画面声

参数选择(不同版本界面不同):

  • 时长:5-8 秒
  • 分辨率:720p 或 1080p
  • 音频:开启(默认开)

Generate

第 4 步:等待生成(通常 1-3 分钟)

Veo 的生成时间比 Sora 略快一些,因为 Google 后端算力相对充裕。

  • 720p、5 秒视频:1-2 分钟
  • 1080p、8 秒视频:3-5 分钟
  • 高峰期可能 5-10 分钟

等待时可以同时跑其他 Gemini 对话,不互相阻塞。

第 5 步:预览、下载、迭代

生成完成后,视频在对话框里直接预览。

  • 满意:点 Download 下载到本地
  • 想改:修改 prompt 重新生成
  • 想多版本:同一 prompt 点 Regenerate 出 2-3 个版本对比

[此处放截图:Veo 生成完成界面,标注下载和重生成按钮]

第 6 步:试用 Veo 的原生音频差异化

写一段 prompt 突出”声画一体”,比如:

A close-up of an old typewriter, fingers typing rapidly, with the mechanical sound of typewriter keys clacking and the bell ding at end of line.

出来的视频会同步出真实的打字机敲击声 + 行末铃声这是 Veo 区别于 Sora 的核心——Sora 出同样画面通常只有画面,没声音,需要你后期配音。

5 个 Veo 进阶玩法

1. 图生视频(Image-to-Video)

部分版本支持上传一张图,让 Veo 让它”动起来”。适用场景:

  • 让电商产品照片做 360 度展示
  • 让一张风景照变成延时视频
  • 让插画角色走两步

注意:图片清晰度直接决定视频质量

2. 多语言原生音频

Veo 能生成中文、英文、日文等多语言的对话音频。在 prompt 里指定:

  • “with a man speaking in Chinese saying ‘欢迎来到东京’”
  • “with a French narrator describing the scene”

适合做多语言内容、跨境电商素材。

3. 跟 Gemini 协同写 prompt

直接在 Gemini 对话框里说”帮我写一段 Veo prompt,描述东京清晨的便利店”。Gemini 会输出结构化的 prompt,你确认后让 Veo 生成。Google 自家工具链的小红利,跟 Gemini 怎么用 一起搭配很顺。

4. 跟 YouTube 工作流集成

Google AI Pro 包含 YouTube 高级功能。生成的视频可以直接在 Google Drive 里管理,剪辑用 YouTube Studio 的 AI 工具继续加工,全程不离 Google 生态。

5. Imagen + Veo 串联

Google AI Pro 同时包含 Imagen 图像生成。你可以先用 Imagen 出风格统一的图,再用图生视频功能让它们动起来。做品牌片或风格化短视频特别合适

常见坑 + 解决办法

现象原因解决
找不到 Veo 入口订阅未到位 / 灰度未开检查 AI Pro 订阅状态,等几小时
生成的视频没有声音Prompt 没写音频描述在 prompt 里明确加 “with [声音描述]“
视频里人脸糊掉当前所有 AI 视频通病镜头远一点、避免大特写人脸
中文 prompt 效果不如英文Veo 英文训练更充分重要内容用英文 prompt,或先让 Gemini 翻译
单段 8 秒不够长Veo 单段时长上限多段拼接,看 AI 视频时长
国内无法访问 gemini.google.com网络问题自己解决 + 换 国产 AI 视频

一个实战案例:30 秒做一段产品广告

假设你卖一款手冲咖啡壶,想做一段 5 秒的产品概念片,带咖啡冲泡的真实音效

第 1 步,在 Gemini 对话框粘贴下面这段 prompt:

📋 Prompt 模板

A premium hand-pour coffee dripper made of clear glass, sitting on a wooden kitchen counter in a warm morning kitchen.

Action: Hot water slowly pours from a copper gooseneck kettle, dark coffee drips into a white ceramic cup below.

Audio: The gentle sound of water pouring, the soft drip of coffee falling into the cup, and birds chirping faintly outside.

Camera: Slow tracking shot from left to right, shallow depth of field, eye level. Lighting: Soft morning sunlight from window on the left, warm color tone. Style: Cinematic, slow motion, 5 seconds, 1080p.

第 2 步,参数选 5 秒 / 1080p,确认音频开启,点 Generate。

第 3 步,等 2-3 分钟,预览。这一段视频同步带咖啡冲泡声 + 鸟叫声,无需后期配音直接发布。

第 4 步,用 YouTube Studio 或剪映加品牌 logo 和卖点字幕,传到详情页。

整套流程,第一次大概 10 分钟,熟练之后 3 分钟一段

国内用户的 3 个替代方案

如果 Veo 的海外门槛太高,国内能解决”声画一体”需求的替代:

  1. 可灵 AI(快手):画面强,音频要后期。可灵 AI 怎么用
  2. 即梦视频(字节):跟剪映同账号,剪映里加音效快。即梦视频怎么用
  3. 海螺(MiniMax):部分版本开始支持原生音频

详细对比看 国内 AI 视频盘点Sora vs Veo

进阶 / 下一步

常见问题

Q:Veo 一个月最多生成多少段视频? Google AI Pro 的月度额度具体以官网为准,过去大致够日常做几十段,Ultra 档更多。重度用户建议直接 Ultra。

Q:Veo 跟 Sora 比,哪个更强? 画面感 Sora 略胜,原生音频 Veo 明显占优。详细十维度对比看 Sora vs Veo 海外两强对决

Q:Veo 能生成多长的视频? 2026 年 Veo 3 单段主流 5-8 秒。更长视频要后期拼接,详见 AI 视频时长

Q:Veo 生成的视频能商用吗? Google AI Pro/Ultra 订阅用户对生成内容有商用权,具体以你订阅时的用户协议为准。重要商业项目建议咨询法务。

Q:Veo 比国产可灵贵很多吗? Google AI Pro 20 美元/月,约 140 元人民币;可灵基础会员几十元/月。Veo 贵 2-3 倍,但同时也包 Gemini 和 Imagen,算综合订阅价值不只是视频