Gemini Omni 模型:比较 Gemini Omni、Veo 3.1、O3、Motion Control 和图像工作流程

七个模型,一个生成器。每个 Gemini Omni 模型处理不同的创意任务——从提示词引导的视频和参考锁定的动画到动作迁移和 AI 图像创建。使用下面的比较表找到适合你工作流程的正确模型,然后开始生成。

浏览所有 Gemini Omni 模型

浏览每个模型页面以获取完整的技术规格、用例和生成示例。

模型比较表

每个 Gemini Omni 模型的并排规格。显示的积分是 5 秒标准片段(720p 16:9,无音频)——实际成本随分辨率、时长和音频而变化。

模型输入输出最大分辨率时长音频积分 (5秒)最适合
Veo 3.1文本 / 图像视频1080p5–20秒~200提示词引导的视频、电影场景、使用草稿模式快速迭代
Veo 3.1图像 + 文本视频1080p5–20秒~75参考引导视频、风格锁定、角色一致性
Veo 3.1图像 + 参考视频视频1080p3–30秒~68舞蹈迁移、手势捕捉、姿势驱动的动画
Veo 3.1图像 + 参考视频视频720p / 1080p3–30秒~60更轻的动作迁移、更低成本的运动捕捉
GPT Image 2文本 / 参考图像图像高达 4K~6风格帧、概念艺术、缩略图、视频前参考
GPT Image 2 Edit图像 + 文本图像高达 4K~6背景替换、对象移除、风格迁移、修复

按任务选择模型

不确定选择哪个模型?将你的创意任务与正确的 Gemini Omni 模型匹配。

常见问题

关于在 Gemini Omni 模型之间进行选择的常见问题。