应该使用哪个 Gemini Omni 模型?

生成前先比较当前 Gemini Omni 工作流:Veo 3.1 用于文本/图像生成视频,Gemini Omni Flash 用于快速视频草稿,GPT Image 2 用于图像生成和编辑。

浏览 Gemini Omni 模型

打开各模型页查看支持输入、设置、价格逻辑和工作流建议。

模型对比表

当前 Gemini Omni 模型页的并排规格。实际积分成本取决于时长、分辨率、质量和音频。

模型输入输出最高分辨率时长音频积分最适合
Veo 3.1文本 / 图像视频支持时可到 4K4 / 6 / 8 秒60+提示词视频、图像生成视频、可选音频和高分辨率最终片段
Gemini Omni Flash文本 / 图像视频支持时可到 4K4 / 6 / 8 秒60+从提示词或最多 3 张参考图快速生成 Gemini Omni 视频草稿
GPT Image 2文本 / 图像图像最高 4K3+AI 图像、参考帧、产品视觉和提示词引导编辑

按任务选择模型

把要完成的工作匹配到支持该输入和输出的模型。

常见问题

关于 Gemini Omni 模型选择的常见问题。