Gemini Omni 视频生成器:在生成之前选择正确的模型

你选择的模型比你编写的提示词更重要。首先选择与你的输出匹配的工作流程——视频草稿、参考引导片段、动作迁移、图像资产或 4K 最终版——然后使用正确的 Gemini Omni 模型生成。

每次生成前预览你的积分成本。一个共享的积分池涵盖所有模型——视频、图像、动作和 4K。

需要视频?

使用 Veo 3.1 进行文本生成视频或图像生成视频草稿,具有强大的运动质量

需要参考控制?

当输出必须匹配风格、身份或构图的参考图像时,使用 Veo 3.1

需要动作迁移?

使用 Motion Control 将参考视频中的运动应用到你的主体

每次生成前预览积分

没有意外。在提交之前查看确切的积分成本——然后决定是便宜地迭代还是提交到更高质量的渲染。

生成前显示成本

当你更改时长、分辨率、质量模式和音频设置时,积分计数器会更新。你在提交之前总是知道成本。

所有模型的一个积分池

视频、图像、动作控制和 4K 都从同一余额中提取。没有单独的钱包或令人困惑的层级拆分。

失败的生成不收费

如果系统无法产生输出,则不会扣除积分。你只为完成的结果付费。

从便宜开始,准备好时升级

使用标准或草稿模式以较低成本进行迭代。仅当方向锁定且输出需要发布时才移至 Pro 或 4K。

我应该选择哪种模式?

选择与你的任务匹配的 Gemini Omni 模型

大多数糟糕的 AI 视频草稿在生成开始之前就失败了——因为用户为工作选择了错误的模型。在编写单个提示词之前,使用本指南选择正确的工作流程。

视频生成 (Veo 3.1 / O3)

视频生成 (Veo 3.1 / O3)

用于文本生成视频、图像生成视频、多镜头序列和参考引导片段。选择 Veo 3.1 用于一般视频,或在参考保真度很重要时选择 O3。

动作和图像工作流程

动作和图像工作流程

用于从参考视频迁移运动,或在视频生成之前创建静态图像资产。

Complete Workflow
01

定义输出

视频片段、参考引导视频、动作迁移、图像资产还是图像编辑。

02

选择模型

Veo 3.1、O3、Motion Control 3.0、Motion Control 2.6、O3 Image 或 O3 Image Edit。

03

添加输入

提示词、参考图像、@element 标签、动作参考视频——模型需要的任何内容。

04

预览积分并生成

检查成本,选择质量级别,然后生成。在提交到 Pro 或 4K 之前便宜地迭代。

用于一般视频

Veo 3.1 处理大多数文本生成视频和图像生成视频任务。强大的运动,良好的提示词遵循,标准/Pro/4K 质量层级。

Veo 3.1

用于参考保真度

Veo 3.1 从参考图像锁定风格、身份和构图。当品牌一致性或角色身份很重要时使用。

Veo 3.1

模型决策指南

我应该选择哪个 Gemini Omni 模型?

每个模型解决不同的问题。选择错误会浪费积分并产生偏离目标的结果。使用本指南。

Veo 3.1 — 一般视频生成

你对大多数视频任务的默认选择。处理文本生成视频、图像生成视频和多镜头序列,具有强大的运动质量和良好的提示词遵循。

最适合:产品片段、广告变体、社交内容、创意探索
输入:文本提示词、可选参考图像、可选 @elements
质量:标准、Pro 和 4K 模式可用
时长:5秒或10秒,16:9、9:16 和 1:1 比例

Cinematic Scene Generation

An AI-generated cinematic scene demonstrating Veo 3.1 text-to-video output.

Veo 3.1 — 参考引导视频

当输出必须在风格、构图或角色身份方面紧密匹配参考图像时使用。比 Veo 3.1 更强的参考保真度。

最适合:品牌一致性、角色身份、风格锁定序列
输入:文本提示词 + 参考图像(为获得最佳结果需要)
质量:标准和 Pro 模式
何时使用而不是 3.0:当参考匹配比创作自由更重要时

Motion Control — 运动迁移

不是一般的视频模型。专门用于当你有静态主体并希望它遵循参考视频中的运动时。

最适合:舞蹈、手势、姿势、镜头运动、产品动画
输入:主体图像 + 动作参考视频(两者都需要)
模型:Veo 3.1 或 Veo 3.1
何时不使用:开放式视频生成——改用 Veo 3.1

O3 Image — 静态图像生成

在移至视频生成之前创建参考帧、产品视觉、缩略图或风格帧。

最适合:参考图像、产品概念、缩略图、风格探索
输入:文本提示词、可选参考图像
输出:1K/2K 或 4K 静态图像
工作流程提示:首先生成图像,然后将它们用作视频参考

O3 Image Edit — 修改现有图像

当图像接近但在成为参考或最终资产之前需要提示词引导的更改时。

最适合:背景替换、对象更改、风格调整、清理
输入:源图像 + 编辑提示词(两者都需要)
输出:源分辨率的编辑图像
工作流程提示:首先编辑,然后将结果用作视频参考

4K 模式 — 交付级输出

不是单独的模型——是支持的工作流程上可用的质量层级。仅在方向锁定后使用。

最适合:最终交付、广播、客户演示、作品集
何时使用:在标准/Pro 草稿确认方向有效后
成本:比标准/Pro 更高的积分——不要用于迭代
规则:首先以较低成本草稿,仅在镜头获得批准时使用 4K
工作流程

从任务到生成的草稿,4 个步骤

从你需要的内容开始,而不是按哪个按钮。正确的模型选择可以节省积分并在第一次尝试时产生更好的结果。

01

命名你需要的输出

视频片段?参考引导视频?动作迁移?图像资产?图像编辑?从结果开始。

任务

02

选择匹配的模型

Veo 3.1 用于一般视频。O3 用于参考控制。Motion Control 用于运动。O3 Image 用于静态图像。

模型

03

添加输入并预览积分

编写提示词,上传参考,检查积分成本。在生成之前调整质量设置。

设置

04

生成、比较、迭代

从标准质量开始以快速迭代。仅当方向确认时才移至 Pro 或 4K。

生成

按任务选择,而不是按工具名称

获得良好结果的最快路径是在编写提示词之前选择正确的模型。以下是何时使用每个模型。

我需要从提示词或图像生成视频片段

使用 Veo 3.1。它处理大多数视频生成任务,具有强大的运动质量。如果你想要视觉引导,添加参考图像,或使用纯文本进行创意探索。

→ Veo 3.1

我需要输出紧密匹配特定参考

使用 Veo 3.1。它优先考虑参考保真度而不是创作自由。当品牌身份、角色一致性或构图必须保留时最佳。

→ Veo 3.1

我需要将运动从一个视频迁移到我的主体

使用 Motion Control。上传你的主体图像和动作参考视频。模型将该运动应用到你的主体。

→ Motion Control

我需要在开始视频工作之前生成图像

使用 O3 Image 生成参考帧、产品视觉或风格探索。然后将这些图像用作视频生成的参考。

→ O3 Image

Answers

Gemini Omni Generator 常见问题

选择正确的 Gemini Omni 模型和工作流程的答案。

选择你的工作流程并开始生成

选择与你的任务匹配的模型。每次任务前预览积分。便宜地迭代,然后在方向锁定时升级到 Pro 或 4K。