Gemini Omni 视频生成器:从文本或图像创建 AI 视频

从提示词开始,需要时添加参考图,选择时长、分辨率、宽高比和可选音频,然后在生成前预览积分。

一个共享积分池覆盖视频和图像工作流。每次生成前预览成本。

需要视频?

使用 Veo 3.1 或 Gemini Omni Flash 进行文本/图像生成视频。

需要视觉控制?

上传参考图来引导产品、角色、风格或首尾帧方向。

需要图像?

使用 GPT Image 2 创建风格帧、缩略图、产品视觉或参考图。

每次生成前预览积分

不惊喜扣费。提交前查看预计成本并调整设置。

提交前显示成本

积分估算会随时长、分辨率、质量和音频设置更新。

一个积分池

视频和图像工作流共用同一余额。

失败生成不收费

积分应只为完成的生成扣除。

先低成本测试,再升级

用更短或静音草稿测试,再生成高质量最终版。

模型对比表

选择匹配任务的 Gemini Omni 工作流

按输出选择:文本视频、图像视频、图像生成、图像编辑或高分辨率最终输出。

视频生成

视频生成

用于文本/图像生成视频,支持可选音频和 4/6/8 秒设置。

图像工作流

图像工作流

用于静态图生成、图像编辑,以及视频生成前的参考帧。

Complete Workflow
01

定义输出

视频片段、图像引导视频、静态图或图像编辑。

02

选择模型

Veo 3.1、Gemini Omni Flash 或 GPT Image 2。

03

添加输入

写提示词,并在有帮助时上传支持的参考图。

04

预览积分并生成

检查成本、选择设置并提交任务。

Veo 3.1

文本生成视频和图像生成视频,支持可选音频、4/6/8 秒片段,以及支持时的 720p/1080p/4K 输出。

Video

GPT Image 2

以 1K、2K 或 4K 档位生成和编辑 AI 图像,用于参考帧、产品视觉、缩略图和概念图。

Image

指南

应该选择哪个 Gemini Omni 工作流?

根据你已有的输入和需要的输出选择工作流。

Veo 3.1

文本生成视频和图像生成视频,支持可选音频、4/6/8 秒片段,以及支持时的 720p/1080p/4K 输出。

文字转视频
图像到视频
可选音频
4/6/8s 剪辑

Cinematic Scene Generation

An AI-generated cinematic scene demonstrating Veo 3.1 text-to-video output.

Gemini Omni Flash

基于当前 VEO 3.1 official 接入的快速 Gemini Omni 视频工作流,适合提示词和图像引导草稿。

快速视频草稿
提示输入
最多 3 张图片参考
可选音频

GPT Image 2

以 1K、2K 或 4K 档位生成和编辑 AI 图像,用于参考帧、产品视觉、缩略图和概念图。

文本转图像
图像编辑
1K / 2K / 4K 层
参考系
工作流程

预览积分并生成

按输出选择:文本视频、图像视频、图像生成、图像编辑或高分辨率最终输出。

01

定义输出

视频片段、图像引导视频、静态图或图像编辑。

任务

02

选择模型

Veo 3.1、Gemini Omni Flash 或 GPT Image 2。

型号

03

添加输入

写提示词,并在有帮助时上传支持的参考图。

设置

04

预览积分并生成

检查成本、选择设置并提交任务。

生成

应该选择哪个 Gemini Omni 工作流?

根据你已有的输入和需要的输出选择工作流。

需要视频?

使用 Veo 3.1 或 Gemini Omni Flash 进行文本/图像生成视频。

Veo 3.1

需要视觉控制?

上传参考图来引导产品、角色、风格或首尾帧方向。

Gemini Omni Flash

需要图像?

使用 GPT Image 2 创建风格帧、缩略图、产品视觉或参考图。

GPT Image 2

Answers

Gemini Omni 生成器常见问题

关于选择正确 Gemini Omni 工作流的答案。

选择工作流并开始生成

选择视频或图像,添加支持的输入,预览积分并生成。